[go: nahoru, domu]

メイン コンテンツにスキップ
ダッシュボードに移動
どこから手をつければよいかわからない方は、簡単なクイズに答えて、パーソナライズされたおすすめを参照してください。
レッスン 2/ 7
機械学習で原稿ネタを調査する
ハンズオン機械学習
機械学習とは何か?
Google Cloud AutoML Vision
データの準備
機械学習モデルをトレーニングする
評価とテスト
check_box_outline_blank Hands-on Machine Learning: Take the Quiz
コース
0% 完了
5 分 で完了

機械学習で原稿ネタを調査する

image23_2_o9fybYX.png

報道における機械学習の活用法

image23_2_o9fybYX.png

調査のための機械学習: 事例

image23_2.png

2010年、世界市場での琥珀の価格が急騰し始めました。需要が高かったため、その後数年で琥珀が豊富なウクライナ北西部の一部が、海外や地元の関心を集め、違法な「琥珀ラッシュ」、新たな「ワイルドウエスト」の舞台になりました。

数百ヘクタールの森林と農地が活気のない月面のような地形に変わり、2014年から2016年にかけて最も激しい採掘活動が行われるものの、その後も何年も続きました。

image23_2.png

Leprosy of the Land 、Textyによる調査

image5_2.png

2018年、ウクライナのデータジャーナリズム機関である Texty は、機械学習技術を用いてウクライナ全土での違法な琥珀採掘の事例を検出する調査「 Leprosy of the Land 」を公開しました。


まず、アルゴリズムが衛星画像の一部の区域をさらに視覚的に均一なサブセクションに分割しました。つまり、ひとつの画像が半分緑の森と半分土の空き地である場合、画像をこの2つのサブセクションに分割します。


別のアルゴリズムは、どのサブセクションが琥珀採掘の既存の例に最も似ているかを発見しました。これは、地面に独特のあばたのようなパターンの穴がはっきりとあいています。 


最後に、ジャーナリストはアルゴリズムが見つけた例を調べ、琥珀採掘のように見えたものが実際には森林伐採のような何か他のものではないことを確認しました。

image5_2.png

違法な琥珀採掘の例を見つける

image7_2.png

本コースでは、以前に別のアルゴリズムでサブセクションに分けられた、大量の衛星画像の中で違法な琥珀採掘の視覚的な例を認識するアルゴリズムをトレーニングするために、Texty が使用した方法に焦点を当てます。

最初のレッスンでも述べましたが、これは教師あり学習で実験するということです。そのアルゴリズムがラベル付けされた例から学習して、これまでに見たことのない画像の同じパターンを認識する方法を学びます。 


また、必要な例を見つけることから、探しているものを認識する機械学習モデルのトレーニング、そして信頼性の高い結果が得られるようにモデルのテストや評価まで、自分の記事ネタのためにどのようにプロセスを再現できるかを学びます。

image7_2.png

機械学習はこの問題に適したツール?

image12_3_TvhzWTX.png

しかし、なぜ機械学習はTextyが探していた情報を見つけ出すのに適したツールだったのでしょうか。 


従来のプログラミングは、コンピュータが従う手順を段階的に指定する必要があります。このアプローチはさまざまな問題を解決するために有効ですが、大量の衛星画像の中の違法な琥珀採掘の例を認識するタスクには達していません。非常に多くの視覚的な要素が存在するため、コンピューターは、違法な琥珀採掘の実際の例と、見た目だけが似ている可能性のあるものを区別するソフトウェアに教えられる段階的な一連のルールを考え出すことは不可能だと考慮する必要があります。

幸いにも、機械学習システムはこの問題を解決するのに適した状況にあります。

image12_3_TvhzWTX.png

プロセスに焦点を当てる

image46_2.png

本コースで学ぶこと、つまり違法な琥珀採掘を見つける方法は、ほんの一例にすぎないことに注意してください。同じプロセスに従えば、さまざまなジャーナリスティックなタスクを実行するために機械学習を利用できるほか、画像だけでなく、いろいろな種類のコンテンツの分析にも適用することができます。コースの最後に、他のいくつかの使用事例を見直します。この演習を行うときは、具体的な事例よりはむしろプロセスに焦点を当てることを忘れないでください。


さて、実際の演習を始める前に、次のレッスンで使用するために学ぶツールを設定し、打ち合わせに数分割く必要があります。Google Cloud AutoML Vision

image46_2.png
おめでとうございます!これで終了です 機械学習で原稿ネタを調査する in progress
あなたへのおすすめ
このレッスンに対する評価をお聞かせください。
お寄せいただいたフィードバックは、レッスンの継続的な改善に役立てさせていただきます。
移動して進行状況が失われてもよろしいですか?
このページから移動すると、現在のレッスンの進行状況がすべて失われます。続行して進行状況が失われてもよろしいですか?