ビッグデータの世界で注目を集めるファイルフォーマットの一つがParquet。データを圧縮させて保持するだけでなく、読み込みやデータの抽出で高いパフォーマンスも誇ります。MATLABでもR2019aからparquetreadとparquetDatastoreなどが登場しましたが、圧縮形式に注意が必要です。
MATLABでWebサーバーに対してファイルアップロードしたいとき、意外と情報が無くて苦戦したので備忘録を作りました。webwriteでは困難なのでmatlab.net.httpのFileProviderを使うと簡単にできました。Node.jsのサーバーで動作確認もしてみます。
地理空間を含むポリゴンデータが複数ある際に、ポリゴンの外郭を求める方法をMATLABのコードで紹介します。R2023a時点ではMapping Toolboxでそのままできないので、地理テーブルをgeotable2tableでテーブルに変換しMATLAB本体のunionを使うのがミソです。
地理空間情報のポリゴンの中にあるか外にあるかを判定したいとき、MATLABではMapping ToolboxのR2022aで導入されたisinterior関数で簡単に計算できるようになりました。国勢調査の東京都のポリゴンを使って動かすコードの説明も付けています。
AWSクラウドに構築したAlmaLinuxにMATLAB環境を構築する手順を説明します。インストーラーを使わずにMPMコマンドを使ってコマンドラインでMATLABをインストールし、必要なAlmaLinuxのパッケージをdnfで追加していく手順を順に紹介します。
※2022/11/28 更新:R2022bで直接スレッドワーカー数を指定可能に。MATLABの並列処理で、R2020aから使えるようになったスレッドベースの並列プール。ワーカー数を指定するオプションがなく、デフォルトでは物理コア数と同じ数のワーカーが立ち上がりますが、あることでワーカー数を指定できるようになります。
シェープファイルを読み取って可視化するのって、プログラミングだと以外と面倒だったりしますが、MATLABではMapping Toolboxが非常に強力です。政府統計データ窓口のe-Statから国勢調査のシェープファイルをダウンロードして、可視化するまでの手順を示します。
クラスターサーバーでHTCondor を使ったジョブスケジューラでMATLAB の処理をしたかったのですが、意外と情報が無くて躓いたので備忘録としてまとめています。
MATLAB のMapping Toolbox no
R2021b 新機能で、readgeotable という関数が登場しました。 位置情報を含むテーブルを直接読み込めるようになっていて、GPX ファイルにも対応しています。Apple Watch のヘルスデータをエクスポートするとワークアウトのデータがGPX で出力されますので、早速試してみました。
コロナ禍で在宅ワークになった方も多いと思いますが、気になるのは健康状態。この記事ではiPhoneとApple Watchでのヘルスケアデータを使って健康状態を解析する事例を紹介しています。コロナ前後での歩数の傾向分析、在宅ワークで運動量を増やすための工夫について書いています。