年末の垂れ流し - 2020年の不幸-

今年も年末ですね。

このブログの記事が年間はてなブログランキングにランクインしていたことを知りました。 *1 blog.hatenablog.com

ページを開いてくれた方が多かったのは嬉しいです。

余談ですが、ランクインするくらい読まれても2020年では10万円くらいしかamazonアドセンス貰えないので、DS関係のブログは労力と知識に対するペイとしては実質赤字です。
営利目的で書いたつもりはないので、そこに言及すること自体あれですが気になってる人も居ると思うので。*2

『怪しすぎる。この記事を書く能力がある人は、この記事を書く労力で儲けられるはずなので、こんな記事を公開するメリットがあるはずがない。』みたいなブックマークコメントがあった気がしますが、その感覚は正解だと思います。
多分、DSとして生きていく上で無料で情報公開することはデメリットでしかないと思います。(しかも匿名だし)
あんな記事を書いてしまった動機は『怪しい狂人のきまぐれ』です。

ちなみに売上の詳細ですが、売れたのは入門本ばかりで専門書はほぼ買われていません。
まぁ私も人から勧められて専門書買うときはAmazonではなく、本屋で立ち読みしてから買いますね……

あと解説を雑にした本はほぼクリックすらされてません。
私はガイドブックとして書き、買わせることは目的としてないので別に良いのですが、書評をちゃんと書かないと本に興味を持ってもらうの難しいんですね。
入門本を買った方は次のステップの本もいつか読んでみて下さい。

f:id:todes-mentor:20201230235730p:plain
売れ筋上位

今年の振り返り

今年は……色々あった気がしますが、覚えてないのであまり言及することがないですね。
国内のDSにとって停滞期だった気がします。表立ってはたいした進展もなく海外に遅れをとった感じ。
あえていうなら分析管理ツールの導入や作業の自動化、クラウド化は進展した気がします。勿論、業種や会社によって色々あるとは思います。
国内産業で言うと、ドコモとNTTの連携が大きな転換点になる気がしました。
ですが政治マターなのでどうなるかわかりません。

私の近所の話をするなら、コロナで「マスク無し入禁」のお店が増えました。
「マスクしたら出禁」になった人も分析界隈には居るようですが。
(多分、この一行は不要だった気がする)

また、コロナしかり、オリンピックしかり、結局日本の意思決定においてデータ分析は無力だなぁ、と感じました。
これは、意思決定において老人の感情が優先されるという話と、全うなデータ分析プロジェクトを展開する能力がない、という二つの問題です。 (もちろん意思決定プロセス自体の問題を指摘することも出来ると思います)

無力だったとはいえ、コロナ関係の分析について私の印象に残ったものが3つありました。 一つは感染症の専門家の論文。これは面白く予測精度も高かった。二つ目は位置情報の利用とその個人情報活用に関する議論が(ちょっと)進んだこと。 三つ目にCOVID-19 Japan - 新型コロナウイルス対策ダッシュボード #StopCOVID19JP が印象に残っています。
他はリテラシーがあれば無意味だとわかる、デザイン設計を間違えている分析、建前だけのプロジェクト、フェイクニュースばかりだった気がします。
OSS、クソ論文は正しい情報・手段へのアクセスを阻害したという面で陰謀論と同じ効力を持ったと思います。
このことは歴史には残らず人の記憶からも忘れ去られた気がしますが、よく記憶していた方が良いと思います。

「じゃあお前はなにか、まともな分析したんか?」と言われると、病床数のデータを集めるのに手間をかけていたら、私の完成予想図よりGood Designなものを公開した人が現れたので手を止めました。
つまり何もしてない駄目人間です。
負け惜しみを言うと、感染が広がってから公開まで本当に早かったにも関わらず、最初から完成されていて、着眼転・センスが良く、社会に対する影響力があり、完成度も高く、社会的意義も深いしで nice hack としか言いようがないです。 まだ悔しいので何が、とは言いませんが。 www.stopcovid19.jp

最近読んで良かった本

上級者向けだが、コードライティングの指針になるものだった。
OSSを上手に書くために必要な技術が書いてあり、コードリーディングしてるときによく気になっていた疑問がこの本で解消された。
ハッカーへのインタビュー記事があり、私くらいのレベル(中堅)のプログラマーに向けて効果的な開発アドバイスをトッププログラマーが語る、という内容で目から鱗だった。

まぁPython学んでお金儲けるのが目的なら、ハッカーを目指すよりもAWSの勉強やデータパイプラインの勉強した方が儲かるだろう。
そういう仕事とクソPythonコードが世の中には溢れている。

そういうの目指すなら、同じくランクインしていたこの記事を読めば、AI技術者()に成れるのではないでしょうか? *3 shinyorke.hatenablog.com

他の本については…リモート勤務で時間が取れるようになると日本語書籍あまり読まなくなった。
洋書とスタンダートな教科書、ソースコード、論文、小説しか読んでない。

前の記事について後日、思ったことをいくつか

匿名の私が個人的な主張を述べても嘘っぽくなってしまうので他人の言葉(ツイート)を(都合よく)引用して個人的なお気持ちを述べる。

評価される項目についてについて、私の考えと違う認識がブコメとかに存在した気がしたので補足する。

上のツイートで言ってることが正しいと私は思う。
この評価指標の思想背景と効用についてグダグダ語りたくなったが、蛇足でしかないので簡単に言う。
時間と労力が有限であること*4を前提として、人材市場から目的の達成に最も貢献してくれる個人を選別する、という視点で考えると自ずとこうなる気がします。
偏見ですが、偏差値70以上の高校とか理系の良い研究室に属した人が持つようになりがちな価値観だと思います。
「元気がある or 元気がない 」みたいな価値観で生きていける村もあると思いますが、こういう村もあるという話です。

上に関連して呪いの言葉を一つ残すと私が書いた例の記事が*5楽で効率的なルートだと思います。*6
半年経っても特に更新する必要を感じなかったので、2023年くらいまでは有効な予感があります。
もちろん、大学の研究室で教授や先輩からワンツーマンで教わったり、論文読んだりする方が早いことはあると思いますが、あそこに書いてあるの初心者向けの入門方法なので、まぁ…

やれば出来ること(プログラミング)が出来ること前提で、訳のわからないことをしない成長率が高い人が好まれる。しかも文化資本パンチを無限連打しても許される世界線だとまぁ加速度的に↓のように人間が変質していくよね。

女子高生が「そろそろディープラーニング始めようかな」とマックでぼやいていたのが2016年。
大学生が電車でスマホを取り出すと「新しいもの使い込なして偉いねぇ」と老人に賞賛される2020年ではないように、2020年は小学生が機械学習を使い込なしていても特段評価すべき事柄ではない。
2020年の日本で「携帯を使えて偉いねぇ」と褒めてもらえるのはIT担当大臣くらいだ。

オンライン講義については

それはそう。自明。私の記事のブコメで『オンライン修士で一発逆転しようず!!』とか騒いでた人達は何を考えているんだろう。

「え、俺30のおっさんだけど、まだ線形代数してない……」「え、うちの子、中学生だけどパソコンの使い方わからない」っていう人は、2021年に向いてないのかも知れない。そんなママチャリで大丈夫か?

次の時代は、SNSを介して『俺は努力したのに報われなかった』という怨念が世の中を埋め尽くす気がしてならない。
そう考えるとBLMは未来の私たちのように感じる。
肌の色が同じせいで自己責任とされUberEats用のママチャリしか持ってない日本のフリーターにはプレゼントを持って老人ホームを慰安巡訪するくらいしかできないだろうし、その行動力も気力もすでに奪われている気がする。

怨念を増幅させながら、人から声や理性を奪う洗脳システムを構築する仕事に○○を感じる。
2010年代の不幸はウォール街が作ったが、2020年代の不幸はAI技術者が作る。○○の最適化が進んでいく。
(○○に相応わしい言葉を辞書引きしようとしたが、Androind/iOSの辞書アプリ促売のためオンライン辞書が廃止されていた。epgwin形式の辞書も配給が途絶えて久しくLinuxでは辞書が引けない。図書館も年末で閉まっていた。)

GAFAについて長文を書いたが全部消した。文字にすると思いの他に強い主張になってしまい、それを十分に裏づけられる程のリファレンスに個人ではアクセスできなかった。
もう先月の一般報道記事すらアクセスできない。記憶しか拠り所がない。

最近、他の仕事、特に医者の仕事について考えることが増えた。
他の職業の人に比べ、私はまっとうなことをしているのだろうか、 誰のために仕事しているのかと考える。
といっても、医者をサポートする仕事をしたい!! ○3に転職しよう!!そして医者を広告クリック中毒、ポイント中毒にして、特定の企業の医薬品を使うよう洗脳しよう!!*7とまで具体的に考えているわけでない。
ただある程度仕事が選べるようになり、DSの仕事の価値について考えることが増えた程度のことかも知れない。

2021年は匿名ブログではないところで nice hack したいね。

追記

音声認識を使いながら10分くらいで(推敲もせず)パッと書き終えて公開した後で、他人のブログを巡回した。
そこで見つけたTJOさんの年末の振り返りが、曖昧で幼稚なことしか言ってない私の年末の振り返りの完全上位互換になっていてきまり悪さを感じた。
似たことを言っていても彼の思考や行動は非常に具体的に説明されている(説明できるだけの実績もバリバリある)ので伊達に長年有名ブロガー、第一人者やっていないんだなぁ、ということを理解させられた。
この、とてつもない差を何度も当事者として感じられたことがこの一連のブログから私が得た一番の成果だ。冒頭で赤字といったがペイした。 tjo.hatenablog.com

追記2 英才教育を受けた/才能のある一部の子供だけが、カタパルトで空を飛び「選ばれる人間」となる。
選ばれなかった人間は、選ばれなかった人間を受け入れてくれる教育機関でトレーニングを積んだところで『選ばれなかった』というレッテルは消えず、逆説的にその焼印の存在を強く意識させられるようになる。
もう「選ばれる/選ばれない」は 「個人が努力したか否か」という問題ではないのだ。
(だから「選ばれるための訓練」を積み正規兵に成れ、と私は言った。)
ママチャリに乗っている人間はあらゆる場において「害悪なので忌避されて然るべきだ」と声高らかに主張する人も居る。
人生の競争において誰が好き好んで遠回りをするのか。 *8
「最強の戦闘機」が排出されることを夢見るしかないから人はガチャを回すのかも知れない。
最適化された広告にそう仕向けられているだけかも知れないけど。

*1:ランキングを見るまでこのブログのことは殆ど忘れていました。

*2:匿名で書いてますがその辺も含め情報はオープンにしたいと思っていた。

*3:年を重ねるごとによく売れそうな本が並ぶようになってきましたね。

*4:+みんな目的に向かって努力出来るくらいセレクションされていること

*5:特に数学的素養のない成人の日本語母語話者にとって

*6:まぁこの記事を読むワナビーの読者が何人居るかは知りませんが

*7:某社の事業はそれだけではないが、これがメイン事業なので私は好きになれない

*8:私は遠回り大好きです

「未経験文系からデータサイエンティスト」はまだ終わりじゃない


    私のブログに対するTJOのアンサー*1に対しては私ははてなブックマークの文字数制限ギリギリで謎のアンサーを返した。
    私の怪文書1を滅茶苦茶読み込んでいたTJOならあれで解読できるだろ。と思ったが私の意図*2と違う方向に業界の舵取りをしようとしていることを考えると少し不安になって来たので、字数制限のないブログ記事で改めて私のアンサーを投稿し、補足説明をする。

謎アンサー文章の文字数制限無し版

    TJOは『データサイエンティストワナビーはCSのPhD持ちエリートには勝てず「マトモなDS職」には着けないから道を諦めろ』と暗に主張する。*3しかしデータサイエンスを学ぶこと自体はこの時代において教養であり、科学的思考を育むことになるので有意義だ。
    TJOは『ワナビーが「まともなDS職」を目指すことは、エリートとポジション争いをすることであり、それはマッタンホルンに無装備で登るようなものでほぼ全員無駄死にするだけだから諦めろ』と言う。しかし私は恐らく100万人以上は居るだろう大量のワナビーにはデータサイエンティストの道(マッターホルン)にチャレンジして欲しいと思っている。 TJOの言うことは本当であり、99%以上は憧れの仕事(Tier 1 DS)には成れず挫折するだろうがそこで生き残れる化け物を私は待っている。私の怪文書の目的も最初からそこにある。
    ワナビーに道を諦めさせなかった場合、競争に勝てず「まともなDS職」に就けなかった「負け組」の大多数が生ずるだろう。でも彼らはそこでホームレスや自殺者になって終わる訳ではない。(彼らの意欲を先人が正しく導ければ)彼らはデータサイエンティストもどき人材・Tier 4のDS・AIリテラシーの高いサラリーマンとして様々な業種に就き『社会的データリテラシー』の向上に寄与することになる。そんな彼らこそが一部のデータサイエンスの専門家と世界的大企業が独占するAIの民主化、DSの仕事の拡大・多様化、本当のAI活用時代の到来には不可欠だ。
    私の主張にも反省するところはある。例えば凡人共もエリートデータサイエンティストに追いつくために頑張るべきだ、と強く主張していたが、それはTJOが「ほぼ不可能」と言っているキャリアであり、実際そうなので無理の強要であり、少し残酷な話だったかもしれない。 これは多くのサバイバー(同志)を待望する私のエゴに他ならない。
    勿論、私はTJOのブログに共感する面もあり、私は検索汚染と情報格差は社会悪だと思っているし、そこに賛同してくれたのは嬉しく思う。

 

未来の話をしよう

    全体的にDSワナビー批判とDSの世界のトップを目指してDSを学ぶ難しさの議論に話が偏ってしまった気がする。本当にDSはトップを目指すべきなのか。ここで次のような状況を想像してみよう。

  • 情報公開を推進するスタートアップ(NPO?)が行政に幼稚園(?)の情報請求を依頼したところ、数万枚のエクセルの印刷書類と莫大な情報開示手数料を請求された話。*4
  • これは架空の話だが、JTCの無理な依頼と担当DSの技術不足から圧倒的に過学習しまくったAI、消費トレンドの変化に全然対応出来ない生産管理システム、こういったクソを数千万円で納品する悪徳DSのお仕事。*5
  • データサイエンスを業務に取り入れたいけど、データをどう集めるかわからない。何が必要かわからないから何も出来ない。とりあえずDS(Tier 5)を採用しよう、から始まる地獄。
  • リクナビDMPがどうしてヤバい重大事件だったかは知らないけど、ウチらは中小だし問題ないよね。データ活用バンバンしてこうず!GDPR?なにそれ?の世界。
  • 人の働きぶりの評価、経営方針、採用方針、市場戦略は社長の勘で決めます。ジャパニーズ勘ピューターアズナンバーワンの会社。
  • 文章校正、データ入力、指差し異常確認、問い合わせ対応、自動運転、力作業のようなAIで代替出来そうな仕事がまだ代替されない現場。

    皆がTier 1のデータサイエンティストに誰もがなれなくても、上で挙げたようなクソみたいな現実がある限り、例えば地方行政×データ活用、JTC文化×データ活用、法律×データ活用、作業着×データ活用、経営×データ活用、○○×データ活用を実現出来る人は活躍出来るし、未来ってそういうのじゃないの?一部の特権階級がデータサイエンスを知っている世界より、みんながデータサイエンスをちょっとずつ知って、ちょっとずつうまく回る世界のほうが良いに決まってるじゃん。だから三ヶ月からでも良いから嘘に踊らされてないで前に進めよ。TJOはDS人材として最低限の人権を得るのに一年以上の時間は必要って言ってるが興味の続く限り、ワナビーがアンドロイドの夢を見るなら少しでも実現に向けて進めば良いじゃん。この世界は解決を待つ魅力的な問題でいっぱいだ。最高の未来の話をしようぜ。

明日のAIブームの話をする。

    何か長文を書いた気がするが、公開する直前に私よりちゃんとしてそうな人が似た話を良い感じでまとめていたので、無かったことになった。
そちらのリンクを貼る。*6これ以上ネットに怪文書を残したくないので……

note.com

おまけ

    あと一つだけTJOに言うならCS PhDを歩むことをさも王道のように扱ってさ。全面肯定してるじゃん。タイトル間違ってるよ。

 

*1:データサイエンティストに王道無し」のこと。このような筆者不定怪文書ブログを読み、言及して下さりありがとうございました。

*2:初稿以降、実は滅茶苦茶追記をしている。文章書くの苦手なんだ。

*3:『3ヶ月じゃ無理』とだけ言いたいのか『座学教育を一年間受けないと無理だから諦めろ』までいってるのか読めなかったが、どちらかと言うと後者のように読めた。

*4:SNSで見た。うろ覚えなところがある

*5:当然架空の話である。身に覚えとか一切ない。

*6:『Ghost of Tsushima』風に要約すると『ブームは浜で死にました。社会に浸透するために』と書いてある。

「未経験文系から3ヶ月でデータサイエンティストになって一発逆転」はここで終わり (2020/7/31 更新)

 データサイエンティストを生業にする手段と実態について述べる。
    途中、具体例・境界値の例として私個人の話もするが、なるべく一般性のある話をする。

  この記事で言いたいことは具体的には4つだ。

  • プログラミングスクールをディスるなら代わりの入門方法を提供しようよ。
  • もう「未経験文系から3ヶ月でデータサイエンティストで一発逆転物語」を止めろ。*1
  • おじさんは人生逆転したいなら真面目にやれ。
  • 若者はワンチャンじゃなくて、ちゃんと化け物になれよ。

この記事についてはパブリック・ドメインとして転載・改変・リンク記載を自由にしてよいです。

(続き書いた)

*1:『【年収1000万円】1.SQL 2.python 3……これらを3ヶ月ガチるだけであの高給取り職「データサイエンティスト」になれることが判明! MARCHと同じレベルとかお前らなら余裕よな? 』(出典:まとめサイト)や
『未経験からデータサイエンティストになる方法』(出典: note.comで売っている人気情報商材)、
嘘松で注目を浴びるインフルエンサーワナビー、人材紹介会社の煽りステマを念頭にしている。

続きを読む