HadoopStreaming で xml ファイルを処理する
HadoopStreaming で xml ファイルを扱う方法の解説です.
この記事では,しろかい!のRSSフィードから <title>
~</title>
を抽出することを目標とします.
また,言語は Python を使用します.
【LIBLINEAR】cross validationに使う評価尺度を変更する方法
LIBLINEARで cross validation (クロスバリデーション, 交差検定) を行う時は,評価指標として Accuracy が用いられます.しかし,用途によってはF
値など,他の指標を使いたい時もあるかと思います.
というわけで,本記事では LIBLINEAR の cross validation に使う評価尺度を変更する方法を紹介します.
LIBLINEARをインストールして簡単な予測を行う
ロジスティック回帰を使って簡単に多クラス分類ができるライブラリ「LIBLINEAR」のインストール方法と,基本的な2つのコマンドである train
と predict
(学習と予測) の使い方のまとめです.
LIBLINEAR は線形分類に特化しており,計算が非常に高速です.
(データが線形分離可能かは予め調べておきましょう)