scikit-learnの4つの特徴と、6つの主な機能を徹底解説!scikit-learnに同梱される初心者用のデータセットを使い回帰と分類の実装を行います。(Python 全実装コード掲載)
機械学習
機械学習の評価指標 分類編:適合率や再現率、AUC(ROC曲線、PR曲線)を解説
分類問題に対する機械学習モデルの評価指標を徹底解説。混同行列(正解率、適合率、再現率) に加えてLog LossやAUC(ROC曲線、PR曲線)など、Pythonの実装コードを交えて解説しました。
seaborn 徹底入門!Pythonを使って手軽で綺麗なデータ可視化8連発
seabornとはPythonのデータ可視化ライブラリで、同じPythonの可視化ライブラリであるmatplotlibが内部で動いています。本稿ではseabornを使って手軽で綺麗なデータ可視化手法を解説します。
MeCabによる形態素解析入門:都知事選のテキストデータで実践!
自然言語処理の中でも基礎的な処理を担う「形態素解析」と、それを実行するための「MeCab」という形態素解析エンジンについての概要を徹底解説。Python上でMeCabを用いて簡単な形態素解析の実装を行います。
ハイパーパラメータとは?チューニングの手法を徹底解説(XGBoost編)
ハイパーパラメータの概要や一般的に使用される3つのハイパーパラメータ最適化の手法を徹底解説。XGBoostを使いランダムサーチ・グリッドサーチ・ベイズ最適化を使います。(全サンプルコード収録)
LightGBM 徹底入門 – LightGBMの使い方や仕組み、XGBoostとの違いについて
LightGBMの使い方や仕組み、XGBoostとの比較などを徹底解説!くずし字データセットを使いLightGBMによる画像認識の実装をしてみよう。実装コード全収録。
PyTorch 入門!人気急上昇中のPyTorchで知っておくべき6つの基礎知識
機械学習には数多くのライブラリが存在します。例えば数値計算処理を効率的に行ってくれる「Numpy」や、データ解析の手助けをしてくれる「Pandas」などです。 また多くの方が利用している「Scikit-learn」や「T […]
特徴選択とは?機械学習の予測精度を改善させる必殺技「特徴選択」を理解しよう
機械学習エンジニアがよく使う表現として「ゴミを入れればゴミしか出てこない」という言葉があります。これは機械学習の特性を表しており、ここで言うゴミとは予測の役に立たないデータを表しています。 一般的なWEBア […]
機械学習上級者は皆使ってる?!アンサンブル学習の仕組みと3つの種類について解説します
機械学習を勉強するにあたり「アンサンブル学習で精度が大幅に向上したよ」や「バギング」「ブースティング」などのキーワードを耳にしたことがあるかと思います。(参照:機械学習とは?) Kaggleなどのデータサイエンス世界競技 […]
今時のエンジニアが知っておくべきディープラーニングの基礎知識
機械学習の中にもロジスティック回帰、決定木、ナイーブベイズ、ニューラルネットワークと様々な学習プロセスが存在しますが、深層学習(別名ディープラーニング)は機械学習の手法の一つです。 2006年にディープラーニングが発表さ […]