戯言日記

Rの話だと思ったら唐突にサバゲーが混じってくる何か。

2021-01-01から1年間の記事一覧

RMarkdownでtargetsパッケージを使って前処理データを引っ張ろうとしたらknitr時にエラーを起こした

この記事はR Advent Calendar 2021 23日目のところに大遅刻して投稿した記事です。 概要 targetsパッケージとRMarkdownを併用しようとしたらエラーが発生 RStudioのRMarkdownの設定でチャンク評価時のディレクトリの設定変更を忘れていたせいだった targets…

ジャンクのマテバを手に入れたので修理

という訳で、つい買ってしまった。 マテバ 以前から見た目がめっちゃ好みでずっと欲しかったところに、ハンマーの動作不良が原因のジャンク扱いで安く出てたのを見つけて、1日悩んでから結局ポチった。 修理できなかったらそのまま飾る予定。 全体 銃身 スイ…

pngの保存形式が変わったと思ってたらggsave()の保存形式が変わっていた

去年の後半に作ったShinyアプリを久しぶりに動かしたら、処理の途中でいきなり落ちるとかいう恐ろしい目にあった。 具体的にはggplot2で作図したグラフをggsave()でpng保存し、それをEBImageパッケージを使って読込と解析をするアプリなのだが、その途中でア…

RのバージョンアップをRからやろうとして失敗したからゴリ押した話

少し前に、メジャーアップデートとしてR 4.1.0が来ていた。 地味に分量が多くて把握しきれていないが、Rネイティブなパイプ「|>」の実装とか、関数の「(x) x+1」表記とかが目立つ変更点かと思う。 せっかくならメジャーアップデートは対応しておきたいので、…

data.tableにfurrr::future_map()を入れるとむしろ速度が低下するっぽい

data.tableに対する処理の一部が妙に重くて困ってたのだが、その原因を調べてたらfurrr::future_map()との食い合わせが最悪だったってことが分かったのでメモ。 data.tableとは data.frameを発展させたデータ形式で、高速かつメモリ効率の良さが売り。 cran.…

「MAD」が問題を抱えすぎている気がする

一昔前に某動画サイトでうpされていたアレの話とかではなくて。 データの標準化の話を調べていた時、「中央絶対偏差(MAD)」に行き当たったのが事の発端。 doubtpad.hatenablog.com このMAD、バラつきに関する指標の1つで、標準偏差と比較すると外れ値に強…

R上でロバストな標準化をしたい

データ分析をする際には各データを標準化するのが一般的だが、大抵の場合は特に何も考えずに平均0、分散1になるよう処理するのが基本だと思う。 これはRならscale()で実行できる。 ただし、この方法では外れ値によって大きく影響を受けることがある1。 ここ…

ガスハンドガンのマガジンメンテナンス

という訳で買ってみた。 KSCのバルブレンチ 仕事が笑えるほど忙しくてブログの更新どころではなかったんだけど、落ち着いたタイミングで約1年ぶりにサバゲーの予約を入れたら何となくマガジンのメンテナンスをしたくなったのでAmazonで買った。 なお今回はち…