2013-10-13

Matlabとmbedは仲が悪い

研究室の同期から設計を頼まれたブツを作るために，センサデータの処理アルゴリズムをMatlabで考えようとしたんやけど，躓いたのでメモ．

まずやろうとしたことは，センサ<==>mbed<==>Matlabでセンサデータを散布図上にリアルタイムプロット．
プロットされたデータを視て，フィルタ考えるなり，アルゴリズム作るなり．
特に難しいことは無い．

しかし，mbedにセンサデータを送らせる為に以下のコマンドを実行すると
> fprintf(s,'T');

>>ERROR:
>>??? Error using ==> serial.fprintf at 144
>>An error occurred during writing.

と悲しい一言を吐いて止まる．

文法とか，データフォーマットとか特におかしいところも無いのに，必ずこのエラーを吐いて止まる．これは困った．

で，ネットで調べてみると，同様の症状で困っている人が．

http://www.mathworks.com/matlabcentral/newsreader/view_thread/299738

どうやらUSB-serial 変換チップのバッファがクリアできないタイプだと起こる現象らしい．

しかも”matlab mbed”でも検索すると，mbedで同様のスレが立ってた．

http://mbed.org/forum/helloworld/topic/3568/?page=1#comment-19556

どうやら，mbedも漏れ無くこのダメチップに該当するようで，根本的な解決策は無いそうなので，Try~Catch で凌ぐしかないようです．
Matlabとmbedはどうやら仲が悪いようです（笑

半日格闘した結果，無事グラフにプロットできましたとさ．
めでたしめでたし．

f:id:pokopokopeke:20131013180231j:plain

2013-10-09

昔の人はすごかった

科学

今週より輪講でPRML(=Pattern Recognition and Machine Learning) まあ機械学習の勉強が始まったわけですが，これが数理的な話がふんだんに出てきて楽しいことこの上ない．

今回のお話はよくある観測時系列データに対する多項式函数フィッティング．
まあ，よく知ってる人なら平均２乗誤差の最小化を使って回帰すればいいんでしょー．という話なんでしょうが．

${y(x,\vec{w}) = w_0 + w_1 x + w_2 x^2 + \cdots + w_M x^M \\ E(\vec{w}) = \frac{1}{2} \sum_{n=1}^{N} \{ y( x_n, \vec{w} ) - t^2 \} }$

$y(x, \vec{w}):$ 推定値， $x:$ 入力データ， $\vec{w}:$ 係数行列， $M:$ 回帰函数の次数， $E(\vec{w}):$ 平均２乗誤差， $t:$ 目標値

僕が面白いとおもったのが，過学習の抑制方法の発想でした．

過学習というのは，本来なら２次函数と推定できれば適切な観測データに対して，９次函数とかで推定してしまって大きく発振した函数になるというやつです．

厄介なのが，２次函数での平均２乗誤差に比べて９次函数での誤差のほうが小さいということなのですよね．
自由度が増えている分，訓練データへの忠実な追随が可能なので当然といえば当然なのですが．

これを抑制するために，以下のアイデアを使っているようです．
誤差値に対して，係数行列のノルムを利用したペナルティ項というものを導入し，過学習を抑えています．
これは，過学習となる時は推定函数が大きく発振する→係数が大きくなるという傾向を用いて，過学習を抑えるというアイデアです．

$\tilde{E}(\vec{w}) = \frac{1}{2} \sum_{n=1}^{N} \{ y( x_n, \vec{w} ) - t^2 \} +\frac{\lambda}{2} ||\vec{w}||^2$

$\lambda:$ 抑制係数

言われてみるど当たり前のことなのですが，このボトムアップ的な発想がすごいなと思います．データサイエンティストに客観的な視点でデータを見る能力が求められると言われるのはこの辺の能力なんだなと妄想．

とまぁ，はてブログでTex書式が使えるのかどうか試すためだけに書いた中身の薄い記事でした．

2013-10-02

採択率30％と20％は大きく違う

科学

相変わらず，熱が下がりません．倦怠感がなくなりません．
ふぅ困ったものだ．
仕方ないから，再度お医者さんに．
すると，体調を自動コントロールする中枢がバグってますねｗと．
ともかくもう風邪ではないらしい．
もらった漢方薬飲んで，早く治そう．

さて，入試とか就職とか，他のライバルに打ち勝って狭き門をくぐり抜けるというのは誰しも経験しているものと思うのです．

こういった競争の話がでてくると，倍率がどのぐらいだとか，採択率何％だとかいう話が出てきますが，これって実際どのくらい難しいことなのか，意外と直感的に分からないですよね．

確かに，倍率２倍と倍率１０倍はぜんぜん違うというのは分かりますし，

宝くじ１等の当選倍率は，数字そのままなら倍率10,000,000倍なので，まぁ当たらないだろうというのは分かります．

しかし，２倍と１０倍ではどう違うの？と聞かれても５倍難しいんじゃない？と答えるのが限界だと思います．

特に研究者の場合，研究予算の採択率がそういったことの１つに当たると思うのですが，この研究予算に関して面白い記事を見つけました．

「大学院生のつぶやき：研究助成の採択率を考える」

http://www.chem-station.com/blog/2010/12/post-221.html

研究費年々減らされてるのに，応募数は増えててやヴぁい．
という記事ですが，気になったのはこの記述．

＞採択率30%程度では、

＞『審査過程はうまく機能し最高の科学研究を選び出すことができる』

＞そうです。一方で、採択率20%以下では

＞『同程度に価値のある複数の助成研究計画書からいずれかを選ぶという、不可能な選択を強いられている感じ』

＞となるようで、採択率が低い状況での審査は

＞『あら探しの場と化し、マイナス思考に包まれ、各委員は、申請案件の長所を取り上げるのではなく、交付金を出さないための言い訳を探すようになる』

＞とまで述べられています。たった10%の違いでもその審査は厳しくなり、本来ならば支援したい研究でも落とさざるを得ない状況となるようです。

採択率30%以下と20%以下では大きな違いがあるとのことですが，何故10%でこの大きな違いが生まれてしまうのかという理由までは触れられていません．

で，その理由を個人的に考えてみたのですが，多分次の理由だからでは無いのでしょうか．

いわゆる，働きアリの法則が当てはまるのではないのかなと思うのです．
20%がガチ働いて，60%が普通で，残り20%がサボってるっていうアレですよね．
まあ，これに当てはめれば一目瞭然なわけです．

採択率30%以下のときは，この働きアリ20%は間違いなく採択されるのです．で，残り10%分を普通60%から選べばよいのです．
しかもこの普通60%は働きアリ20%に比べて申請書の評価関数の分散も大きくなるので，選びやすいということになります．

しかし一転，採択率20%以下の時は，この働きアリ集団から選ばなくてはならないわけです．
ただでさえ良く出来る集団なので，評価関数的にも高得点で横並びして，分散も小さくなります．
するとあら探しするしか無いのです．
しかも，本当は通したい申請書から無理やり落とす理由を考えなくてはならないわけです．当然，公平な判断ができなくなることもあるわけです．

なのでまー，
研究費だけで無いですが，何事も挑むなら20%以上で少しでも高い採択率のものを選ぶほうが良いわけです．
逆に20％以下のモノに挑むなら，いくらちゃんとやっていても通るかどうかは運次第ということになります．

うん，いとおもしろきことなり．

2013-09-28

データサイエンティストとは何なんだろう．

科学

”ビッグ・データ”とも関連することだけれども，
ちょっと陳腐感出てきた割に，未だに掴みどころの無い職業？やね．

前から，調べてたり考えたりしても，どうもこのデータサイエンティストってのは自分の言葉で説明できなかったんだけど，探してたらこんな人のBlog見つけた．

http://tjo.hatenablog.com/

尾崎隆さんというデータサイエンティストの方らしい．
元々は東大，理研で，脳信号のデータマイニングを専門にやられてて，そのあとサイバーエージェントに移られたそうな．
うん，なかなか興味深い人種の方である．

少しずつ読み下していくことにしよう．

2013-09-28

２０１３年秋期アニメ考察

アニメ

はてさて，中間発表も終わったことですし，２０１３年秋季アニメに関して考察みたのですよ．

http://uzurainfo.han-be.com/13a.html

まあ，いとおもしろきアニメは無いのかもしれない．

いや，今期が充実し過ぎていただけなのかもしれない．とも言う．

今期は，何と言っても有頂天家族がfantasticやったと思う．
「どんなアニメなの？とかどこが面白いの？３行で説明してよ！」と聞かれると，
「どんなアニメなの？とかどこが面白いの？３行で説明してよ！
と聞かれると
非常に難問となるアニメ」
としか答えようがない．

まぁ，あえて言うならば「家族愛」なのかな．
特に，矢三郎と海星のやりとり
海星「・・・うちの阿呆兄貴・・・」
矢三郎「・・・またあの阿呆兄貴が，・・・」
海星「うちの兄貴たちを阿呆というな，この腐れ毛玉。でもまぁ・・・」
いくら嫌いな兄貴とはいえ，
家族を大事に思う海星には感服するものです．
その心，忘れてはいかんなと思う．

うん
２０１３年秋期アニメ考察と言いながら，
２０１３年夏期アニメの感想になってしまいました．
後悔はしてない．