AI マガジン by codexa

機械学習の評価指標 分類編:適合率や再現率、AUC(ROC曲線、PR曲線)を解説

学校での成績評価や会社での人事評価といったように、評価というのは、社会で生きる人々にとって常について回るものですね。しかし、評価するというのは、身近でありながら案外難しいことではないでしょうか? 重要なひとつの点で優れていればいいのか、あるいは全体的にバランスよく優れていることに対して高い評価をつけ ...
続きを読む

seaborn 徹底入門!Pythonを使って手軽で綺麗なデータ可視化8連発

データの可視化はなぜ必要なのでしょうか。それは、そのデータを生み出している事象をより正確に理解したり、機械学習での予測に用いる際に、使うべきデータを適切に選んだりするためです。そのためにはまず、データを可視化することによって、データの大まかな特徴をつかんだり、データ同士の相関関係を知ることが必要なの ...
続きを読む

MeCabによる形態素解析入門:都知事選のテキストデータで実践!

昔から、様々なアニメや漫画、映画で「喋るロボット」と人間との関わりが描かれてきました。かつては夢物語に過ぎなかったであろう「喋るロボット」ですが、近年、それが現実のものになりつつあります。そして、そのようなコンピューターによる言語の認識を支えている技術が、「自然言語処理」です。 自然言語処理とは、英 ...
続きを読む

今注目のAI関連資格「G検定」とは?合格者が勉強法を徹底解説!

「AI」。2020年6月、Googleでこのように入力して検索をかけると、約30億件もの情報にヒットします。「Japan」を検索した際のヒット数も同じく約30億件だったことから、現在、世界でどれほどAIが注目されているのかがお分かりになるかと思います。本稿を読んでくださっているみなさんも、おそらく機 ...
続きを読む

Kaggle初心者必見!Kaggle Notebookの使い方を徹底解説

本稿ではKaggleの初心者向けにKaggle Notebookの基本的な使い方を解説します。本記事で紹介するKaggle Notebookとは機械学習エンジニアのためのKaggleというプラットフォームのサービスです。このKaggleでは、企業や研究者がデータを投稿し、世界中の統計解析やデータ分析 ...
続きを読む

ハイパーパラメータとは?チューニングの手法を徹底解説(XGBoost編)

機械学習エンジニアは様々なタスクをこなさなくてはいけません。ビジネスへの影響や軸となる指標などを決める要件定義から始まり、データの収集や前処理、そしてモデル構築や調整など、機械学習の実装までのタスクをあげればきりがありません。(組織の規模にもよりますが) 本稿ではモデルの調整、さらに厳密に言うと「ハ ...
続きを読む

LightGBM 徹底入門 – LightGBMの使い方や仕組み、XGBoostとの違いについて

Kaggleなどのデータ分析競技を取り組んでいる方であれば、LightGBM(読み:ライト・ジービーエム)に触れたことがある方も多いと思います。近年、XGBoostと並んでKaggleの上位ランカーがこぞって使うLightGBMの基本的な使い方や仕組み、さらにXGBoostとの違いについて解説をしま ...
続きを読む

PyTorch 入門!人気急上昇中のPyTorchで知っておくべき6つの基礎知識

機械学習には数多くのライブラリが存在します。例えば数値計算処理を効率的に行ってくれる「Numpy」や、データ解析の手助けをしてくれる「Pandas」などです。 また多くの方が利用している「Scikit-learn」や「TensorFlow」なども機械学習の現場では頻繁に活用されるライブラリの一つです ...
続きを読む

TensorFlowとは?不動産の価格をTensorFlowを使って予測してみよう(入門編)

機械学習をやってみたいけど何から初めて良いか解らないと思ったことはありますか?もしそうでしたら、この記事はそんな方に向けて書かれています! 本記事では「TensorFlow 入門」として、Googleが提供する機械学習フレームワークである「TensorFlow」を使って、不動産価格を予測する流れをま ...
続きを読む

R言語とは?機械学習エンジニアが知っておくべきR言語の概要やPythonとの比較まとめ

多くのエンジニアが「機械学習 = Python」というイメージをお持ちかも知れません。確かに日本国内では機械学習の実装にはPythonが圧倒的に使われているのも事実です。(参考:何故機械学習にPythonが使われるのか?) 機械学習の経験・レベルを積み上げる中で、接する頻度が増えるプログラミング言語 ...
続きを読む