45周年Liveってやつに

行ってきました。

f:id:yamcat2015:20150908205713p:plain

 

開場が幾分遅れつつ(本編で「ごめんね,間に合うわけないって言ってたんだよ」って謝ってはりました。「でも長くなるんだよ(笑)」って一言*1),生憎の激しい雨。テンション微妙に下がりつつ,開場を待ちます。結果15分ほど入場が遅れた感じでした。

その影響もあって,開演が10分ほど押してLive開始。まずは加奈崎さんとの古井戸パート。解散後35年ぶりと言ってたと思いますが,よかったと思います(すみません,淡泊な感想でorz)。Liveで使ってはるマンドリンにそんな歴史があろうとは。

で,どうやら45年を時系列で振り返るって感じかなと思ったのは,その後のRCセクションの映像を見ながら。こればっかりは再現できないし,映像で仕方ないよね,とあきらめていたのですが,なんと映像からつないでくれたのは「よォーこそ」!(Chabo Bandメンバの皆さんそれぞれに投影中にスタンバイされてたのです)ちょっと来ました。

続いて「君僕」「ハイウェイのお月様」「チャンスは今夜」「いい事ばかりはありゃしない」といったある意味おなじみの曲につなげてくれました。このあたりで「清志郎,聞いといて」ってな感じの一言をはさみつつの演奏です。

「チャンスは今夜」の後トークで「今日の曲リストに入れるかどうか迷った。年齢的に(笑)」といった軽口や「『いい事ばかりは』を初めて聞かされたのはXXのスナック(地名忘れましたorz)。『スナック』っていかにも昭和だね。サビをいじるか議論したけど,いじらなくてよかったね」といった話も。そうそう,「チャンスは今夜」の後に「まだまだ悪さしようぜ,清志郎」って言ってた気がします。

で,RC後半のソロ活動から「ティーンエイジャー」「打破」といったあたりを。「ティーンエイジャー」は「ひと頃,石田長生(さん)がレパートリーにしてくれてた」とか「打破」については,「とあるLiveで片山さんがなかなか舞台に上がってこないからリフを100小節くらい繰り返した」といったエピソードを披露(笑)。

このあたりで,ゲストの呼び入れで麗蘭土屋公平さん。ひとまず「HUSTLE」と「ミュージック」。改めて出会いの頃のことなどをつなげてくれました。蘭丸からはお祝いのメッセージ。久しぶりに「頑張ってしゃべってる」って感じ(笑)。

今回のメインはChabo Bandってことで,「BLUE MOON」,ポエトリー・リーディングも交えつつ,新しい「レコード」に収録してるっていう何曲か。大体,ここまででまずは一区切りって感じでした。

いったん引っ込んで調子を整えた上で,再登場。ソロ曲を織り交ぜつつ,今日の参加者みんなを呼び込み。で,「『Liveで盛り上がる曲作ろうぜ』って清志郎と作ったんだ」って感じの紹介に続けて加奈崎さんの「Come on, Chabo! (OK, Chabo!じゃなかった)」ってコールからの「雨上がり」!ここもかなり来ました。

「Yeah!ってYeah!」のバリエーション「Yeah!ってYeah!ってYeah!って」がじわじわ来ました。

他にもここに書ききれないほどの曲を披露してくれた4時間弱!!(16:40くらいの開演で会場を出たら20:30前でした)まだまだ思い出しきれないあれこれもありますが,「Chaboさん,その元気はどこから」と聞きたくなるくらい満ち足りたLiveでした。

*1:長くなるから開演を早めたケド,時間通りに開場は無理だったってこと

word2vecでさらに遊ぶ

コーパスによって単語の関係性にどれだけ違いが出るのか試してみました。

専門領域の用語として pitch, intensity, durationという3語を取り上げて,(古い)英辞郎と過去15年ほどの論文150本ほどをそれぞれ学習対象にしてみます。

まずは(古い)英辞郎

$ ./distance eijiro.bin

pitch を見ると

Enter word or sentence (EXIT to break): pitch

Word: pitch Position in vocabulary: 2530

Word Cosine distance
------------------------------------------------------------------------
swing 0.547932
hitter 0.521852
homer 0.514385
shot 0.511093
ball 0.498884
pitched 0.492131
sidearm 0.488452
throw 0.487487
batter 0.484926
pitcher 0.484573

と野球関連のつながりが多いようですね。

続いてintensity。

Enter word or sentence (EXIT to break): intensity

Word: intensity Position in vocabulary: 4108

Word Cosine distance
------------------------------------------------------------------------
luminosity 0.619719
spectrophotometry 0.603217
zodiacal 0.602022
spectroscopy 0.601598
monochromatic 0.599959
diffraction 0.595164
emissivity 0.593120
pulsed 0.592664
reflectance 0.574812
spectrometer 0.571763

なんか別分野の用語が多い感じ(^_^;;)。

そしてduration。

Enter word or sentence (EXIT to break): duration

Word: duration Position in vocabulary: 6222

Word Cosine distance
------------------------------------------------------------------------
periods 0.614564
interval 0.530581
shorter 0.530262
drawdown 0.527689
period 0.522462
payables 0.504385
durability 0.504005
termer 0.501189
recency 0.498010
lapse 0.494745

単複両方エントリしていたりして正規化が足りませんが,ご勘弁を。日常語彙という感じです。

 

続いて論文データを母集団にします。

$ ./distance articles.bin

pitchはこう。
Enter word or sentence (EXIT to break): pitch

Word: pitch Position in vocabulary: 139

Word Cosine distance
------------------------------------------------------------------------
fo 0.550375
f0 0.520453
rising 0.487682
falling 0.462313
contour 0.461940
intensity 0.455840
flat 0.431401
nuclear 0.428915
range 0.417038
accents 0.415764

いやぁ,わくわくするような関係性です(笑)。

続いてintensity。

Enter word or sentence (EXIT to break): intensity

Word: intensity Position in vocabulary: 153

Word Cosine distance
------------------------------------------------------------------------
constant 0.598782
amplitude 0.534910
manipulations 0.523191
f0 0.516113
duration 0.507572
range 0.503098
manipulation 0.497692
pitch 0.478521

ちょっと10個に届きませんでしたが(正規化失敗orz),これまた物理量と感覚量とか考えさせられます。

そしてduration。

Enter word or sentence (EXIT to break): duration

Word: duration Position in vocabulary: 45

Word Cosine distance
------------------------------------------------------------------------
duration 0.639721
intensity 0.533702
manipulations 0.469546
manipulation 0.467540
shortest 0.447489
dip 0.445082
f0 0.441383
amplitude 0.441203
durations 0.438589
increases 0.426070

となって,この3つの単語の当方の専門領域での関係性の深さやら,manipulationとの結びつきとか実験手法をいろいろと考えさせるものになっているように思います。

 

なお今回はMBAに構築したvmware上で仮想化したUbuntu 12.04LTSで処理しました。

Raspberry piにword2vec(その弐: 英辞郎の旧版を使って結果を比べてみた)

前回とりあえず word2vec を放り込んでみたRaspberry pi。
こんな記事
word2vecに英辞郎データを放り込んでみた - naoya_t@hatenablog

があったので,たまたま手元にずいぶんと昔の版があることもあって比較してみました。枝番81のバージョンです。Raspberry piには64GBのmicroSDカードをアダプタかまして挿入しています。
前処理から学習までは上の記事に合わせました。なお,どれだけ時間がかかるか不安だったので,前処理はMac mini上で終わらせて,Raspberry piをコンセントにセット。

#本筋から外れますが, homebrew でインストールしていた mecab の挙動が怪しかったので検索したらこんな情報に助けられました。
mecab を使おうとするとエラーが出る - メモ帳

でき上がった eiji-sep.txt をRaspberry piにsftpして学習開始。残したメモだと17:50開始で20:40終了という感じですからこの時点で3時間弱かかっています。

word2vecの集計では
Vocab size: 96656
Words in train file: 13223889
Words/thred/sec: 11.56K
という数値でした。

で,ここからが(ある意味)面白いのですが,同じ問い合わせをします。間引いて,いくつか結果を貼り付けますね。
(1) "find"
$ ./distance eijiro.bin
Enter word or sentence (EXIT to break): find

Word: find Position in vocabulary: 595

Word Cosine distance
------------------------------------------------------------------------
discover 0.593705
devote 0.588240
have 0.572565
commend 0.569735
bothering 0.569357
tells 0.566539
sincerely 0.564717
choose 0.547419
recommend 0.547338
considers 0.546779
scarcely 0.546496

(2) 「決める」
Enter word or sentence (EXIT to break): 決める

Word: 決める Position in vocabulary: 2776

Word Cosine distance
------------------------------------------------------------------------
定める 0.583123
挙げる 0.573505
探す 0.547788
に当たり 0.543472
見いだす 0.542970
選ぶ 0.541947
唱える 0.539804
日取り 0.538196
求める 0.536096
とる 0.534735
済ませる 0.531598
投じる 0.531458

(3) word-analogy: see : 見る = find : X
$ ./word-analogy eijiro.bin
Enter three words (EXIT to break): see 見る find

Word: see Position in vocabulary: 494

Word: 見る Position in vocabulary: 388

Word: find Position in vocabulary: 595

Word Distance
------------------------------------------------------------------------
ちらりと 0.453926
一瞥 0.432471
垣間見る 0.425661
鼻歌 0.424832
特徴付け 0.422913
流し目 0.419370
さげすん 0.418935
じろりと 0.415768

って感じで,バージョンが変わると出てくる結果が結構影響されるように思いました。加筆修正の影響でしょうか。

Raspberry piにword2vec

自然言語処理の分野でword2vecって面白い手法が出てきてるらしい。

unnonouno: Statistical Semantics入門の発表をしました

Python - Perl + Java = ? はてなブログのデータとパソコン工房のPCを使って「word2vec」で遊んでみた - はてなニュース

関連領域でもこんな記事が出てたりします。

word2vecに英辞郎データを放り込んでみた - naoya_t@hatenablog

Web上の記事だけだとなかなかとっつきにくかったのですが,Ebookだけとは言えこんな書籍まで出た

O'Reilly Japan - word2vecによる自然言語処理

ということで,いぢってみました。

上の書籍ではオペレーションシステムとしてapt-getができるものを想定しているそうで借りてるVPSだったら問題なく入りそう(実際後で試したら入った)。でもそれじゃ面白くないよね,ってことでapt-getはできるけどシステム要件的にきびしそうなRaspberry piへのインストールを試してみました。

ソースコードをダウンロードするところまでは何の問題もなかったのですがコンパイルでちょっとてこずりました。

Debian (squeeze)にword2vecをインストール - 森薫の日記

こちらのページにあるようにMakefileに手を入れて再挑戦。まだまだ,ってことで

-march=native

 を削除して make で,何とかコンパイル完了。

 サンプルのtext8の学習にRaspberry piだと4時間以上かかったんじゃないかな。

考えたら乾電池サーバ(Amazon.co.jp: cheero Power Plus DANBOARD version -mini- 6000mAh マルチデバイス対応 モバイルバッテリー: 家電・カメラ なので正確には乾電池じゃないけど)でこんな処理ががしがしとできるご時世になったんですねぇ。

 

word2vecは素人なりの用途としたら学習者の英作文コーパス母語話者の作文コーパスとの比較とかできそうかも。

 

 

MBAのトラブル

手に馴染んでるMBAですが,今日ログアウト->ログインしたらいきなり,Finderが立ち上がって起動プロセス終了っぽい。おいらの環境だとログイン項目をかなり読み込ませて自分なりの作業環境を作り込んでるので,Finderしか上がっていない状態だと逆に手も足も出ない状況なのです。

 

あわててTime Machineをつないで,さてどの項目をRestoreしたらいいのかと調べてみたら,ログイン項目は ~/Library/Preferences/loginwindow.plist に保存されてるらしい。

 

ログイン項目(StartUp Item)の初期設定ファイルについて: Apple サポートコミュニティ

 

ここでややこしいことに最近のOS XだとLibraryフォルダが素直に表示されないのですね。ということでLibraryフォルダにアクセスするにはFinderからoptionキーを押しながら「移動」メニューを開くという一手間が要ります。

 

非表示のユーザーライブラリフォルダーにアクセスする方法(Mac OS X 10.7 以降)

 

でPreferencesフォルダに入った状態でTime Machineに入って前回保存していた同名ファイルをRestoreしたのですが,再ログインしてもなぜか状況は改善されず。

 

この段階でloginwindow.plistを開いてみると(Xcodeがデフォルトアプリに設定されてます),AutoLaunchedApplicationDictionaryをキーにして設定されてるログイン項目が記述されてることは確認できました。

 

ということは起動時にパーミッショントラブルでplistファイルが読み込めない状況かなとの想定で,手っ取り早く再起動時にcommand + Sを押しっぱなしにしてシングルユーザモードで立ち上げ。

#/sbin/fsck -fy

を入力してファイルシステムのチェック + 修復。

Your Macintosh HD seems OK.

とメッセージが出たら,念を送りながら

#reboot

して再ログイン。

 

何とかなりました。ほっ。

 

なお,好ましい解決策はアプリケーション > ユーティリティ > ディスクユーティリティで「ディスクのアクセス権を修復」だと思います。

 #それにしても何でloginwindow.plistのパーミッションが変わっちゃったのかが不明。

パーソナルクラウドを用意した(2012年4月版)

以前にも書いたとおり,仕事柄自分で好きな容量を確保できるパーソナルクラウドを用意しているわけなのです。
Twitter / @yamcat2015: 例えば『音声研究』Vol.14 No.2を検索可能な ... http://bit.ly/I5s3s5

これまで使っていたのはPogoplug(初期バージョン)でした。

Pogoplug ブラック POGO-P25

Pogoplug ブラック POGO-P25


これだったと思うんだよね。

で,Pogoplug Mobileが出て,「高速化」が図られているらしいとのことで,これをベースに乗り換えを検討しました。
【清水理史の「イニシャルB」】 第476回:小型化&スマホ対応を強化した「Pogoplug Mobile」の実力を検証〜無料で使える5GBのクラウドストレージも -INTERNET Watch http://bit.ly/JL7Vq4

SoftBank パーソナルクラウド Pogoplug Mobile(SB-PG01-MBLE)

SoftBank パーソナルクラウド Pogoplug Mobile(SB-PG01-MBLE)

せっかくpdf論文とかの保存に使おうと考えているわけなので,ある程度データの保全も必要だよね,ということでRAIDで構築することにしました。

ガワとして用意したのはこちら。

ラトックシステム USB3.0 RAID HDDケース(HDD2台用) RS-EC32-U3R

ラトックシステム USB3.0 RAID HDDケース(HDD2台用) RS-EC32-U3R

3.5インチHD2台でRAID1で組むことにしました(ちなみにより確実性を求めるのであれば例えばこんなオプションもありそうです)。

センチュリー 裸族のインテリジェントビル USB3.0+eSATAコンボ RAID機能付3.5インチSATA-HDDケース CRIB35EU3

センチュリー 裸族のインテリジェントビル USB3.0+eSATAコンボ RAID機能付3.5インチSATA-HDDケース CRIB35EU3

中に入れるHDはWDの適当な1T*2台を買ってきました。この辺のやつです。

WESTERN DIGITAL 3.5インチ内蔵HDD 1TB SATA 6.0Gb/s 64MB WD10EARX-R

WESTERN DIGITAL 3.5インチ内蔵HDD 1TB SATA 6.0Gb/s 64MB WD10EARX-R

最初に,買ってきた2台のHDをガワに挿入。特にネジ止めとか必要なく,メカニカルなロック方式です。Disk1とDisk2用のドライブベイでコネクタの位置が逆になることだけ注意が要るかもしれません(説明書にも記載されています)。

適当なPCにつないでフォーマットだけしました。ベアドライブだったので。

Pogoplug Mobile自体の用意は,これまで使っていたPogoplugと同じくほんの数ステップでOK。
1. 本体に電源ケーブルをつないだらコンセントに挿す
2. LANケーブルでルータにつなぐ
3. さっき用意したRAIDドライブをPogoplug Mobileに添付のUSB3.0 <-> USB2.0ケーブルで接続
4. マニュアルに従って, mypogoplug.com/ja/activate/ にアクセスしてアクティベーション。ソフトウェアをインストールします。

単純にNASとしてネットワーク越しに利用するだけだったら,ここまで準備したらOS標準のファイルブラウザでのぞけます。33,518円 + ざっと30分といったところで,パーソナルクラウドの出来上がり。Why don't you give it a try?