MATLABでのParquetファイルの読み込み アイキャッチ画像
ビッグデータの世界で注目を集めるファイルフォーマットの一つがParquet。データを圧縮させて保持するだけでなく、読み込みやデータの抽出で高いパフォーマンスも誇ります。MATLABでもR2019aからparquetreadとparquetDatastoreなどが登場しましたが、圧縮形式に注意が必要です。
FileProviderを使ったMATLABからのファイルアップロード アイキャッチ画像
MATLABでWebサーバーに対してファイルアップロードしたいとき、意外と情報が無くて苦戦したので備忘録を作りました。webwriteでは困難なのでmatlab.net.httpのFileProviderを使うと簡単にできました。Node.jsのサーバーで動作確認もしてみます。
日立データ分析の教科書4.6 アイキャッチ画像
データサイエンスのビジネス用の書籍として役立つ日立製作所のLumada データサイエンスチームが書いたデータ分析の教科書。サンプルコードもあるのですが、うまく行かないつまづきどころもいくつかあります。ファイルのダウンロードやフォルダー置き場などを解説していきます。
Pythonのwordcloudでカスタム画像のスタイルを適用
テキストの登場頻度を可視化するワードクラウド。Pythonのwordcloudモジュールには、画像に合わせてテキストの色や形をプロットさせるスタイルを指定できます。ここでは公式サンプルのアリスの画像から、カスタム画像(オシドリの鳥)に合わせたプロットまでを紹介します。
MATLABでジオポリゴンの外郭を求める方法 アイキャッチ画像
地理空間を含むポリゴンデータが複数ある際に、ポリゴンの外郭を求める方法をMATLABのコードで紹介します。R2023a時点ではMapping Toolboxでそのままできないので、地理テーブルをgeotable2tableでテーブルに変換しMATLAB本体のunionを使うのがミソです。
東京都の港区の中にあるか外にあるか判定した結果
地理空間情報のポリゴンの中にあるか外にあるかを判定したいとき、MATLABではMapping ToolboxのR2022aで導入されたisinterior関数で簡単に計算できるようになりました。国勢調査の東京都のポリゴンを使って動かすコードの説明も付けています。
AWSとAlmaLinuxとMATLABのアイキャッチ画像
AWSクラウドに構築したAlmaLinuxにMATLAB環境を構築する手順を説明します。インストーラーを使わずにMPMコマンドを使ってコマンドラインでMATLABをインストールし、必要なAlmaLinuxのパッケージをdnfで追加していく手順を順に紹介します。
サーバーのイメージ画像
※2022/11/28 更新:R2022bで直接スレッドワーカー数を指定可能に。MATLABの並列処理で、R2020aから使えるようになったスレッドベースの並列プール。ワーカー数を指定するオプションがなく、デフォルトでは物理コア数と同じ数のワーカーが立ち上がりますが、あることでワーカー数を指定できるようになります。
Djangoのチュートリアルのサンプルアプリ
PythonのWebフレームワークとして人気のDjango(ジャンゴ)。本格的なWebアプリを構築するためにフルスタックの機能が提供されています。NodeJSのExpressの開発経験がある立場としてDjango初挑戦の感想を書きました。インストールからクイックスタートのサンプルアプリの作成とブラウザでの確認までです。