Matlabとmbedは仲が悪い
研究室の同期から設計を頼まれたブツを作るために,センサデータの処理アルゴリズムをMatlabで考えようとしたんやけど,躓いたのでメモ.
まずやろうとしたことは,センサ<==>mbed<==>Matlabでセンサデータを散布図上にリアルタイムプロット.
プロットされたデータを視て,フィルタ考えるなり,アルゴリズム作るなり.
特に難しいことは無い.
しかし,mbedにセンサデータを送らせる為に以下のコマンドを実行すると
> fprintf(s,'T');
>>ERROR:
>>??? Error using ==> serial.fprintf at 144
>>An error occurred during writing.
と悲しい一言を吐いて止まる.
文法とか,データフォーマットとか特におかしいところも無いのに,必ずこのエラーを吐いて止まる.これは困った.
で,ネットで調べてみると,同様の症状で困っている人が.
http://www.mathworks.com/matlabcentral/newsreader/view_thread/299738
どうやらUSB-serial 変換チップのバッファがクリアできないタイプだと起こる現象らしい.
しかも”matlab mbed”でも検索すると,mbedで同様のスレが立ってた.
http://mbed.org/forum/helloworld/topic/3568/?page=1#comment-19556
どうやら,mbedも漏れ無くこのダメチップに該当するようで,根本的な解決策は無いそうなので,Try~Catch で凌ぐしかないようです.
Matlabとmbedはどうやら仲が悪いようです(笑
半日格闘した結果,無事グラフにプロットできましたとさ.
めでたしめでたし.
昔の人はすごかった
今週より輪講でPRML(=Pattern Recognition and Machine Learning) まあ機械学習の勉強が始まったわけですが,これが数理的な話がふんだんに出てきて楽しいことこの上ない.
今回のお話はよくある観測時系列データに対する多項式函数フィッティング.
まあ,よく知ってる人なら平均2乗誤差の最小化を使って回帰すればいいんでしょー.という話なんでしょうが.
僕が面白いとおもったのが,過学習の抑制方法の発想でした.
過学習というのは,本来なら2次函数と推定できれば適切な観測データに対して,9次函数とかで推定してしまって大きく発振した函数になるというやつです.
厄介なのが,2次函数での平均2乗誤差に比べて9次函数での誤差のほうが小さいということなのですよね.
自由度が増えている分,訓練データへの忠実な追随が可能なので当然といえば当然なのですが.
これを抑制するために,以下のアイデアを使っているようです.
誤差値に対して,係数行列のノルムを利用したペナルティ項というものを導入し,過学習を抑えています.
これは,過学習となる時は推定函数が大きく発振する→係数が大きくなるという傾向を用いて,過学習を抑えるというアイデアです.
言われてみるど当たり前のことなのですが,このボトムアップ的な発想がすごいなと思います.データサイエンティストに客観的な視点でデータを見る能力が求められると言われるのはこの辺の能力なんだなと妄想.
採択率30%と20%は大きく違う
相変わらず,熱が下がりません.倦怠感がなくなりません.
ふぅ困ったものだ.
仕方ないから,再度お医者さんに.
すると,体調を自動コントロールする中枢がバグってますねwと.
ともかくもう風邪ではないらしい.
もらった漢方薬飲んで,早く治そう.
さて,入試とか就職とか,他のライバルに打ち勝って狭き門をくぐり抜けるというのは誰しも経験しているものと思うのです.
こういった競争の話がでてくると,倍率がどのぐらいだとか,採択率何%だとかいう話が出てきますが,これって実際どのくらい難しいことなのか,意外と直感的に分からないですよね.
確かに,倍率2倍と倍率10倍はぜんぜん違うというのは分かりますし,
宝くじ1等の当選倍率は,数字そのままなら倍率10,000,000倍なので,まぁ当たらないだろうというのは分かります.
しかし,2倍と10倍ではどう違うの?と聞かれても5倍難しいんじゃない?と答えるのが限界だと思います.
特に研究者の場合,研究予算の採択率がそういったことの1つに当たると思うのですが,この研究予算に関して面白い記事を見つけました.
「大学院生のつぶやき:研究助成の採択率を考える」
http://www.chem-station.com/blog/2010/12/post-221.html
研究費年々減らされてるのに,応募数は増えててやヴぁい.
という記事ですが,気になったのはこの記述.
採択率30%以下と20%以下では大きな違いがあるとのことですが,何故10%でこの大きな違いが生まれてしまうのかという理由までは触れられていません.
で,その理由を個人的に考えてみたのですが,多分次の理由だからでは無いのでしょうか.
いわゆる,働きアリの法則が当てはまるのではないのかなと思うのです.
20%がガチ働いて,60%が普通で,残り20%がサボってるっていうアレですよね.
まあ,これに当てはめれば一目瞭然なわけです.
採択率30%以下のときは,この働きアリ20%は間違いなく採択されるのです.で,残り10%分を普通60%から選べばよいのです.
しかもこの普通60%は働きアリ20%に比べて申請書の評価関数の分散も大きくなるので,選びやすいということになります.
しかし一転,採択率20%以下の時は,この働きアリ集団から選ばなくてはならないわけです.
ただでさえ良く出来る集団なので,評価関数的にも高得点で横並びして,分散も小さくなります.
するとあら探しするしか無いのです.
しかも,本当は通したい申請書から無理やり落とす理由を考えなくてはならないわけです.当然,公平な判断ができなくなることもあるわけです.
なのでまー,
研究費だけで無いですが,何事も挑むなら20%以上で少しでも高い採択率のものを選ぶほうが良いわけです.
逆に20%以下のモノに挑むなら,いくらちゃんとやっていても通るかどうかは運次第ということになります.
うん,いとおもしろきことなり.
データサイエンティストとは何なんだろう.
”ビッグ・データ”とも関連することだけれども,
ちょっと陳腐感出てきた割に,未だに掴みどころの無い職業?やね.
前から,調べてたり考えたりしても,どうもこのデータサイエンティストってのは自分の言葉で説明できなかったんだけど,探してたらこんな人のBlog見つけた.
尾崎 隆さんというデータサイエンティストの方らしい.
元々は東大,理研で,脳信号のデータマイニングを専門にやられてて,そのあとサイバーエージェントに移られたそうな.
うん,なかなか興味深い人種の方である.
少しずつ読み下していくことにしよう.
2013年秋期アニメ考察
はてさて,中間発表も終わったことですし,2013年秋季アニメに関して考察みたのですよ.
http://uzurainfo.han-be.com/13a.html
まあ,いとおもしろきアニメは無いのかもしれない.
いや,今期が充実し過ぎていただけなのかもしれない.とも言う.
今期は,何と言っても有頂天家族がfantasticやったと思う.
「どんなアニメなの?とかどこが面白いの?3行で説明してよ!」と聞かれると,
「どんなアニメなの?とかどこが面白いの?3行で説明してよ!
と聞かれると
非常に難問となるアニメ」
としか答えようがない.
まぁ,あえて言うならば「家族愛」なのかな.
特に,矢三郎と海星のやりとり
海星「・・・うちの阿呆兄貴・・・」
矢三郎「・・・またあの阿呆兄貴が,・・・」
海星「うちの兄貴たちを阿呆というな,この腐れ毛玉。でもまぁ・・・」
いくら嫌いな兄貴とはいえ,
家族を大事に思う海星には感服するものです.
その心,忘れてはいかんなと思う.
うん
2013年秋期アニメ考察と言いながら,
2013年夏期アニメの感想になってしまいました.
後悔はしてない.