機械学習に関する記事の選択:事例、ガイド、および研究-2020年8月





私たちはあなたのためにMLエリアから資料を収集し続けます。いつものように、空でないリポジトリへのリンクを含むプロジェクト、または高レベルのAPIを提供するプロジェクトを優先します。





アイリス



MediaPipe、空間内のオブジェクトを認識するためのオープンソースMLソリューションに特化した会社- FaceMeshとHandposeのように、それに基づいて、我々はデモを組み立て-新しいツール提示アイリスを。名前が示すように、この機械学習モデルは、単純なRGBカメラを使用して、虹彩、瞳孔、および目の輪郭をリアルタイムで認識します。 10%未満の誤差で、深度センサーなしで被写体とカメラの間の距離も決定します。残念ながら、これまでのところ、アルゴリズムは人を特定できないため、人がどちらの方向を向いているかを判断できませんが、ポーズアニメーターと組み合わせることで、より「ライブ」なアニメーションキャラクターを作成できるため、漫画マスクのトレンドを待っています。







FMKit



Mediapipeは、機械学習アルゴリズムを使用して高価な周辺機器の問題を解決しようとしているだけでなく、アリゾナ大学の研究者は、特別なコントローラーなしでVRまたはAR環境と対話する方法を開発しました。

彼らのアルゴリズムはあなたの指で空中に書かれた単語を認識します。入力デバイスなしで行うことはまったく不可能でした。開発者はLeapMotionモーションキャプチャセンサーを使用しています。FMKitソースコードとデータセットを備えたGitHub チューリッヒのスイス高等技術学校の







スタイルとセマンティクスの



研究者は、オープンなニューラルネットワークを開発しましこれにより、生成された画像を高レベルの属性とテキストの説明で操作できます。モデルの入力で、クラスを持つオブジェクトのマスクを指定できます。ニューラルネットワークは、構造が似ている画像を作成します。テキストクエリを使用して、画像のコンテンツを編集できます。モデルは2段階で機能します。最初に、画像の背景が作成され、2番目に、ジェネレータは、作成された背景を考慮して画像の前景を合成します。これにより、前景から画像を削除または移動するときに背景に表示されるアーティファクトの問題が解決されます。







セマンティックリアクター



カスタマーサービスチャットボットやクエストゲームなどの言語ベースのアプリケーションを構築している場合は、このツールに興味があるかもしれません。 Semantic Reactorは、独自のデータに対して自然な言語理解モデルを実行できるGoogleSheetsプラグインです。このブラウザゲームは、ツールの機能を示しています。幸い、ロシア語を含む16ペアでトレーニングされた多言語モデルもサポートしています。



フォークス



機械学習は、解決できる多くの倫理的論争を引き起こします...同じ機械学習。シカゴ大学の研究者は、ピクセルレベルの変更を写真で人間の目に見えないようにして、他のモデルで使用できなくなるアルゴリズムを開発しました。彼らはこのプロセスを画像マスキングと呼んでいます。彼らは、匿名のマスクのおかげで誰にでも知られているガイ・フォークスに敬意を表して楽器に名前を付けました。作成者は、偽装した写真をソーシャルネットワークに投稿できると主張しており、顔認識モデルのトレーニングに使用した場合、マスキングを使用すると、歪みのためにモデルが写真内であなたを認識できなくなります。彼らが言うように、ウェッジウェッジ。







シー&スプレー



農業における機械学習の事例研究。世界最大の農業機器メーカーであるジョン・ディアは、雑草をよりよく制御するために、機械学習とコンピュータービジョン技術に目を向けました。ニューラルネットワークは、画像から雑草を識別し、即座に除草剤を噴霧します。これにより、作物に損傷を与えることなくリソースを節約できます。 PyTorchフレームワークは、すべてのモデルのトレーニングに使用されました。雑草が他の作物と外部的に類似しているため、作成者が最初に直面した困難は、データセットの準備とラベル付けでした。ロボットは迅速に決定を下し、フィールド内を移動する必要があるため、デバイスにモデルを展開することも困難でした。



AIエコノミスト



経済政策の策定とその有効性の評価は、例えば、世界的な大流行を背景に目立つように、周囲の世界の変化に追いついていない。さらに、経済モデルには多くの仮定が必要であり、現在の経済状況を完全に説明する能力が制限されます。たとえば、所得税を個別に調査することはできますが、消費税を除外することはできます。



Salesforceは、これらの問題を解決するためのMLアルゴリズムを提案しており、強化学習と経済モデリングを使用して、データに基づいて新しい経済政策を迅速に設計および評価するフレームワーク公開しています。



ScaNN



タイトルまたは作成者の完全一致を必要とするクエリを使用して記事の大規模なデータベースを検索することも難しくありません。そのようなパラメータは簡単にインデックス付けされるためです。より抽象的なクエリの場合、2つのフレーズ間の一般的な単語の数など、類似性の指標に依存できなくなりました。たとえば、クエリ「サイエンスフィクション」は、2番目のクエリにクエリと一致する単語が1つある場合でも、「サイエンス」よりも「未来」に関するものです。



機械学習モデルは言語の理解に優れており、入力を埋め込み、類似した入力をクラスターに結合するようにトレーニングされた単語のベクトル表現に変換できます。 Googleは、そのようなベクトルのためのオープンソースの類似性検索ツール導入しました







1つの画像から人を再レンダリングする



単一の画像に基づいて人を再レンダリングするのは難しい作業です。現代のアルゴリズムは、体の部分や衣服の非現実的な歪みなどのアーティファクトを作成することがよくあります。

この研究は、人々がテクスチャの再レンダリングを通じて新しい服に着替えることを可能にする新しいアルゴリズムを示しています。単一の画像から再構築して簡単に変更できるパラメトリックグリッドで姿勢と体の形を示します。カラーUVマップの代わりに、作成者は属性マップを使用して外観をエンコードすることを提案します。これまでのところ、品質は弱く、ソースはありませんが、このテクノロジーがまもなくEコマースにどのように適用されるかはすでに想像できます。



ボーナス: 5月にビデオのフレームの深さを決定するアルゴリズムについてですが、ビデオのデモンストレーションのみを評価することが可能でしたが、プロジェクトのソースコードが利用可能になりました



以上、ご清聴ありがとうございました!



All Articles