AI マガジン by codexa

scikit-learn 入門:6つの機能と分類・回帰の実装方法を徹底解説!

皆さんは、scikit-learn(よみ:サイキット・ラーン)をご存知でしょうか。Pythonを使っている方、機械学習を学ばれている方なら一度は耳にしたことがあることでしょう。しかし、scikit-learnを知っている方の中でも、scikit-learnでいったい何ができるのか、その全貌を知ってい ...
続きを読む

機械学習エンジニアのリアルな実態調査 – 仕事内容や年収から、必須のスキル・経験まで!

機械学習エンジニアと聞いて、皆さんはどのような職種をイメージするでしょうか?「機械学習のスペシャリスト」、「給料高そう」、「トレンドの分野だから求人も多そう」などではないでしょうか。しかし、日本ではまだ新しい職種であるため、具体的にはイメージしづらいのではないかと思います。 そこで、本稿では、求人情 ...
続きを読む

機械学習の評価指標 分類編:適合率や再現率、AUC(ROC曲線、PR曲線)を解説

学校での成績評価や会社での人事評価といったように、評価というのは、社会で生きる人々にとって常について回るものですね。しかし、評価するというのは、身近でありながら案外難しいことではないでしょうか? 重要なひとつの点で優れていればいいのか、あるいは全体的にバランスよく優れていることに対して高い評価をつけ ...
続きを読む

seaborn 徹底入門!Pythonを使って手軽で綺麗なデータ可視化8連発

データの可視化はなぜ必要なのでしょうか。それは、そのデータを生み出している事象をより正確に理解したり、機械学習での予測に用いる際に、使うべきデータを適切に選んだりするためです。そのためにはまず、データを可視化することによって、データの大まかな特徴をつかんだり、データ同士の相関関係を知ることが必要なの ...
続きを読む

MeCabによる形態素解析入門:都知事選のテキストデータで実践!

昔から、様々なアニメや漫画、映画で「喋るロボット」と人間との関わりが描かれてきました。かつては夢物語に過ぎなかったであろう「喋るロボット」ですが、近年、それが現実のものになりつつあります。そして、そのようなコンピューターによる言語の認識を支えている技術が、「自然言語処理」です。 自然言語処理とは、英 ...
続きを読む

今注目のAI関連資格「G検定」とは?合格者が勉強法を徹底解説!

「AI」。2020年6月、Googleでこのように入力して検索をかけると、約30億件もの情報にヒットします。「Japan」を検索した際のヒット数も同じく約30億件だったことから、現在、世界でどれほどAIが注目されているのかがお分かりになるかと思います。本稿を読んでくださっているみなさんも、おそらく機 ...
続きを読む

Kaggle初心者必見!Kaggle Notebookの使い方を徹底解説

本稿ではKaggleの初心者向けにKaggle Notebookの基本的な使い方を解説します。本記事で紹介するKaggle Notebookとは機械学習エンジニアのためのKaggleというプラットフォームのサービスです。このKaggleでは、企業や研究者がデータを投稿し、世界中の統計解析やデータ分析 ...
続きを読む

ハイパーパラメータとは?チューニングの手法を徹底解説(XGBoost編)

機械学習エンジニアは様々なタスクをこなさなくてはいけません。ビジネスへの影響や軸となる指標などを決める要件定義から始まり、データの収集や前処理、そしてモデル構築や調整など、機械学習の実装までのタスクをあげればきりがありません。(組織の規模にもよりますが) 本稿ではモデルの調整、さらに厳密に言うと「ハ ...
続きを読む

LightGBM 徹底入門 – LightGBMの使い方や仕組み、XGBoostとの違いについて

Kaggleなどのデータ分析競技を取り組んでいる方であれば、LightGBM(読み:ライト・ジービーエム)に触れたことがある方も多いと思います。近年、XGBoostと並んでKaggleの上位ランカーがこぞって使うLightGBMの基本的な使い方や仕組み、さらにXGBoostとの違いについて解説をしま ...
続きを読む

PyTorch 入門!人気急上昇中のPyTorchで知っておくべき6つの基礎知識

機械学習には数多くのライブラリが存在します。例えば数値計算処理を効率的に行ってくれる「Numpy」や、データ解析の手助けをしてくれる「Pandas」などです。 また多くの方が利用している「Scikit-learn」や「TensorFlow」なども機械学習の現場では頻繁に活用されるライブラリの一つです ...
続きを読む