Logo ja.androidermagazine.com
Logo ja.androidermagazine.com

Google Duplexとは何ですか?

目次:

Anonim

Google I / O 2018で、Googleの最新のクールな機能であるDuplexのデモを見ました。 ステージ上の60フィートの画面には、Google Assistantアプリのように見えるものが表示され、美容師に電話をかけ、予定を設定し、一時停止、うーん、ああ、人間の発話に伴うその他の特異性。 予定を取っている人は、コンピューターのように聞こえないため、コンピューターと話していることを知りませんでした。 少しでもありません。

その種のデモは驚くほどに見えます(そして少し気味が悪いかもしれません)が、詳細はどうでしょうか? デュプレックスとは何ですか? それはどのように機能しますか? これとは異なるものを見たとき、私たち全員に質問があり、インターネットに広がる答えを見つけるのは苦痛です。 Google Duplexについてこれまでに知っていることを見ていきましょう。

Google Duplexとは何ですか?

GoogleのAI研究者および開発者によると、人工知能(AI)を使用して「電話で現実世界のタスクを実行」することを目的としたGoogleの新しいツールです。 今のところ、それは予約などの非常に具体的なタスクを意味しますが、この技術は他の分野への拡大を見据えて開発されています。 夕食を予約するためのクールな方法を作成するために数十億を使うことは、Googleがすることのように聞こえますが、時間やお金を大きく使うことではありません。

デュプレックスは、デモで見た以上のものであり、ラボを離れると、ラボで見たり聞いたりするよりもはるかに多くなります。 膨大な量のデータバンクとそれを処理するコンピューターがあり、それらは最終結果ほどクールではありません。 しかし、コンピュータを人に話したり考えたりさせることは、人間のように難しいので、不可欠です。

これは、音声読み上げと同じではありませんか?

いや。 程遠い。 そして、それが大したことです。

デュプレックスは、コンピューターが電話で「話す」方法を変更するように設計されています。

Duplexの目標は、物事を自然に聞こえるようにし、アシスタントがその場で考えて、適切な予約時間を見つけることです。 ジョーが「はい、それについて- 10まで開いているものがありません」と言ったら、それでいいですか? アシスタントは、ジョーが言っていることを理解し、それが何を意味するのかを理解し、ジョーが提供するものがあなたのために機能するかどうかを考える必要があります。 10時に町中で忙しく、ジョーのガレージまで車で40分かかる場合、アシスタントはそれを把握して11:15が良いと言うことができる必要があります。

Googleにとっても同様に重要なのは、Duplexが応答し、人間のように聞こえることです。 Googleは、電話をかけている人がコンピューターと話していることを知らないようにしたいと言っていますが、最終的には通知するのが最善だと判断しました。 人々と話すときは、電話でアシスタントと話すときや、DMVのコンピューターと電話をかけるときよりも速く、あまり形式的ではありません(読む:コンピューターの観点からの一貫性のないせせらぎ)。これ返信時に再作成します。

最後に、最も印象的なのは、デュプレックスがコンテキストを理解しなければならないことです。 金曜日 、 次の金曜日 、および 来週以降の金曜日 はすべてあなたと私が理解している用語です。 デュプレックスもそれらを理解する必要があります。 同じように入力した場合、これは問題になりませんが、 それは聞こえないので、私たちはすべての人生を聞いて混乱しているわけではありませんいいえ、あなたがそれを理解していることを知っているか、そのようなものはありません。

あなたが大声で言っている間にそれをタイプした後、私は私のエディターに応急処置を施します。

デュプレックスはどのように機能しますか?

ユーザー側から見ると、アシスタントに何かをするのと同じくらい簡単です。 今のところ、前述のように、何かは予約に限定されているので、「Hey Googleが火曜日の朝にJoe's Garageでオイル交換の予約をします」と言います(それから電話してください) Joe's Garageをセットアップして設定し、カレンダーに追加します。

継続会話では、Duplexと同じ基盤技術の多くが使用されます。

かなり気の利いた。 しかし、カメラの外で起こることはさらにすてきです。

デュプレックスは、リカレントニューラルネットワークと呼ばれるものを使用しています。 GoogleのTensorFlow Extendedテクノロジーを使用して構築されています。 Googleは、音声認識ソフトウェアと、会話の履歴や時刻や場所などの詳細を考慮する機能を組み合わせて使用​​することを選択した場合に、聞くことを許可した匿名ボイスメールとGoogle Voice会話すべてについてネットワークをトレーニングしました両当事者の。

基本的に、高性能コンピューターのネットワーク全体がクラウド内のデータを処理し、携帯電話のアシスタントや、アシスタントが搭載されている他の製品を介して話しています。

セキュリティとプライバシーはどうですか?

簡単なことです。Googleを信頼しますか。 デバイス上のマシンインテリジェンスは本物ですが、制約があり比較的新しいものです。 GoogleはMLキットを開発して、開発者がデバイス自体でこの種のことをもっと行えるようにしましたが、それはすべて計算能力の問題です。 この方法でヘアの予約を行うには、信じられないほどの計算が必要であり、携帯電話やGoogle Homeでそれを行う方法はありません。

そのスマートな製品を使用するには、データでGoogleを信頼する必要があります。Duplexも同じです。

Googleは、アシスタントが今できる特別なことを行うために、個人データの多くを活用する必要がありますが、Duplexはそれを変更しません。 ここでの新機能は、会話を聞くことをGoogleに明示的に許可していない別の関係者がいることです。

Duplexが誰でも使用できる実際の消費者向け製品になった場合、裁判所で批判され、異議を申し立てられることを期待してください。 そして、そうあるべきです。 Googleに私たちのプライバシーに最適なものを決定させるのは、2匹のキツネの古い格言と夕食を決定する鶏のようなものです。

携帯電話でデュプレックスを使用できるのはいつですか?

今年後半にアシスタントにいくつかの大きな変更が加えられる予定です。

今誰も知らない。 それは決して起こらないかもしれません。 Googleは、この種の素晴らしいことを実行でき、それを世界と共有したいと思うと興奮します。 だからといって、それが成功したり、実際の製品になったりするわけではありません。

現時点では、Duplexは閉じた監視された環境でテストされています。 すべてがうまくいけば、レストランの予約、ヘアサロンの予約、電話での休日時間の取得を目的とした消費者向けの最初の実験的リリースが今年後半に電話のみでアシスタントを使用して行われます。

詳細はどこで入手できますか?

Googleは、Duplexの作成に使用している技術について驚くほどオープンです。 以下のWebサイトで関連情報を見つけることができます。

  • Google AIブログ(Google)
  • ディープマインド
  • Tensorflow.org
  • コーネル大学図書館
  • Google Research(Google)
  • キーワード(Google)
  • MLキット(Google)

もちろん、私たちはDuplexにも密接に追随しており、最新の開発が利用可能になり次第すぐにここで聞くことができます。