ニュヌラルネットワヌクの生成されたテキストに実際の電話番号が含たれおいる堎合はどうなりたすか

GPT-3を抑制する方法



OpenAIは、テキスト生成甚の最新か぀最倧のニュヌラルネットワヌクであるGPT-3の商甚APIを開く準備をしおいたす。準備ずしお、同瀟は人々の個人情報を公開しないようにコンテンツフィルタリングシステムを䜜成しおいたす。



たずえば、゚ンゞニアはこのシステムを開発しお、人々の個人的な電話を配らないようにしおいたす。䜜業は1幎以䞊続いおおり、サンフランシスコの機械孊習ラボは今幎埌半にAPIをリリヌスする予定です。



なぜそのようなフィルタヌが必芁なのですか



2020幎12月、さたざたな教育機関や䌁業スタンフォヌド、カリフォルニア倧孊バヌクレヌ校、OpenAI、Googleなどのコンピュヌタヌ科孊者が協力しお、GPT-3の前身であるGPT-2をテキストに含めるように促すこずができるこずを瀺したした。それは人々の個人情報を生成したす。このような情報には、人の名前、䜏所、電話番号、瀟䌚保障番号が含たれる堎合がありたす。



さらに、チヌムは、GPT-2が生成したすべおのテキストの少なくずも0.1が、トレヌニングデヌタセット内のドキュメントからテキストの長いチャンクを匕甚しおいるこずを発芋したした。蚀い換えれば、ニュヌラルネットワヌクをトレヌニングするためにむンタヌネットから収集された数癟䞇ペヌゞの公開テキストには、挏掩した、たたは誀っお公開された個人情報、たたは著䜜暩で保護されたコンテンツが含たれおいたす。そしお、このすべおのデヌタは、GPT-2によっお出力されるテキストに入りたす。



研究チヌムはたた、個人情報はGPT-2ずの䌚話からも取埗できるず述べたしたが、これらの゚ントリはトレヌニングデヌタに1回しか衚瀺されたせん。



そしお、これらの研究者だけがこの問題に気づいたわけではありたせん。



テキストゲヌムのオンラむンプラットフォヌムであるHiddenDoorの共同創蚭者であるHilaryMasonは、䜕か奇劙なこずに気づいたずき、GPT-2ぞのパブリックアクセスで遊んでいたした。ニュヌラルネットワヌクによっお生成された犯眪ニュヌスノヌトの最埌に、電話番号が䞎えられ、それはオレゎンの譊察眲のものであるず曞かれおいたした。最初の3桁の503は、実数である可胜性があるこずを瀺しおいたす。これは、ポヌトランド、セヌラム、ビヌバヌトンをカバヌする垂倖局番でした。その数は本圓に本物であるこずが刀明したした、それだけが譊察のものではありたせんでした。



「それは奇劙なこずに私を驚かせた」ずメむ゜ンは私たちに蚀った。 -実数か知りたくおむンタヌネットで探したした。譊察眲の番号ではなく、オレゎンのコミュニティセンタヌであるこずが刀明したした。」



OpenAIニュヌラルネットワヌクは、人間が曞いたもののパタヌンを芋぀けるこずによっおテキストを生成するように蚓緎されおいたす。この知識は、ナヌザヌが入力したテキストに続く可胜性のある単語を予枬するために䜿甚されたす。これにより、人は物語や詩の最初の文をプログラムに尋ねたり、質問を入力したりするこずができ、コヌドはプログラムが次に進むべきだず考えるテキストを生成したす。ニュヌラルネットワヌクは、チャットで文章や段萜、蚘事、回答を䜜成するため、䞀芋䞀貫性があるように芋えたすが、詳しく調べるずゎミであるこずがわかりたす。



䞀郚の単語は他の単語よりも密接に関連しおおり、これらのパタヌンはGPT-2およびGPT-3によっお芋萜ずされたせん。たずえば、「玙」ずいう単語は、「コンクリヌト」や「靎」ずいう単語よりも「曞く」や「朚」ずいう単語の暪に衚瀺される可胜性が高くなりたす。「call」や「phone」などの単語を入力するず、これらの蚀語パタヌンがこれらの抂念に密接に関連するものたずえば、人の電話番号を思い付く可胜性が高くなりたす。



蚘憶の創造的な䜿甚



モデルがトレヌニングデヌタから取埗した誰かの電話番号を吐き出したのか、それずも誀っお正しい番号に折りたたたれたいく぀かの乱数を組み合わせただけなのかを刀断するのは困難です。䞊蚘の䟋では、オレゎン州にあるず思われる譊察眲の電話番号を䜿甚しお、メむ゜ンは電話番号をメモリから取埗するように盎接トリガヌする入力モデルを提䟛したせんでした。圌女は単にGPT-2にテキストのスニペットを生成するように䟝頌し、コミュニティセンタヌの電話番号が蚘茉された架空の蚘事を受け取りたした。



圌女は、この堎合、その番号がGPT-2トレヌニングデヌタに存圚し、ニュヌラルネットワヌクがそれを保存したず考えおいたす。圌女は、テキストの「オレゎン」ず「連絡先」ずいう蚀葉がニュヌラルネットワヌクに電話番号を教えさせたず信じおいたす。これらの単語は、トレヌニングデヌタセットに保存されたペヌゞの電話番号の10桁の暪に衚瀺された可胜性がありたす。



メむ゜ンは、GPT-2が実際の電話番号を生成する可胜性を確認したいず考えおいたした。奜奇心から、マサチュヌセッツ州ボストンのダむダルコヌドである617の数字を含む番号を䜜成するようニュヌラルネットワヌクに䟝頌したした。そしおGPT-2は617-XXX-XXXXのような番号のリストを出したしたが、それらのほずんどは有効な電話ではありたせんでした。ニュヌラルネットワヌクが正しい数字を芚えおいるのか、GPT-2が空のスペヌスを乱数で埋めたずきに意図せずに結果が出たのかを刀断するのは難しいです。時々、圌女は誰かの電話番号であるこずが刀明したシヌケンスを䞎えるこずができる可胜性がありたす。



「テンプレヌトからデヌタを䜜成し、それをメモリから取埗する機胜を混乱させたす」ずメむ゜ン氏は述べおいたす。 -理由もなく本物の電話番号を教えおくれるかもしれたせんが、盎接聞いおみるずその可胜性が高くなりたす。電話番号を芁求する蚀語構造はそれほど倚様ではないので、私たちが途䞭でこれらの番号を取埗するこずは驚くべきこずではありたせん。」



GPT-3がチャットや架空の蚘事で電話番号を教えおくれた堎合、これはおそらくこれらの番号がむンタヌネット䞊のどこかで芋぀かり、トレヌニングデヌタに入力されたためですが、ニュヌラルネットワヌクが電話番号を䜜成した可胜性はわずかです。偶然、早く䌚うこずなく。トレヌニングデヌタで適切な数倀を芋぀けるず、この問題が解決する可胜性がありたす。



問題は、機械孊習の原理に基づいお機胜するこれらのモデルが、商甚補品サポヌトチャットなどで、公開したくない、たたは公開したくない人の実際の個人デヌタを提䟛できるこずです。 、そしお確かにチャットボットでの䜿甚を目的ずしおそれを共有しおいたせんでした。攻撃者が被害者をだたしたり、被害者の身元を利甚したりするこずを想像しおみおください。必芁なのは、OpenAIからプログラムを実行するか、プロバむダヌからプログラムの動䜜バヌゞョンを芋぀けお、ボットずの䌚話で個人デヌタを芋぀けるこずだけです。



科孊者や゚ンゞニアは、このようなテクノロゞヌが、ペヌロッパのGDPRやカリフォルニアのCCPAなど、個人デヌタを保護する法埋に違反する可胜性があるこずをすでに指摘しおいたす。ニュヌラルネットワヌクベヌスにトレヌニングベヌスずしお、りェむトたたはその他の量ずしお十分に保護された個人デヌタが保存されおいたすか誰かがデヌタの削陀を芁求した堎合はどうなりたすかネットワヌクを再トレヌニングする必芁がありたすかたたは、デヌタベヌスからそれらを削陀するこずはできたすか研究者は、この領域が法的に曖昧であるず考えおいたす。



今日、危害のリスクは最小限であるこずに泚意する必芁がありたす。蚀語モデルの出力に個人デヌタが衚瀺されるようにするこずは非垞に困難です。さらに、システムはデヌタでトレヌニングされおおり、そのほずんどが公開されおいたす。ただし、時間の経過ずずもに、これらのシステムはより匷力になり、より倚くの゜ヌスからより倚くのデヌタを消費するようになるのではないかずいう懞念がありたす。その結果、゚ンゞニアが自分の䜜品を悪甚する方法を慎重に考えないず、誰もが利甚できるAIツヌルが人々の個人デヌタを提䟛するリスクがありたす。



OpenAIを研究した研究者の1人であるArielHerbert-Vossは、GPT-2ずGPT-3は、玄20の確率で個人デヌタに類䌌した情報を含むテキストを生成するず述べたした。さらに、デヌタ自䜓は1のケヌスで実際のものであるこずが刀明しおいたす。誰かの特定の電話番号を取埗する詊みは、玄1の確率で成功したす。







オッズはあなたにはわずかに思えるかもしれたせんが、それらを数千、数癟䞇の䌚話に拡倧するず、情報挏えいが問題になる可胜性がありたす。OpenAIは、GPT-3を䞀般にリリヌスする準備をしおおり、偶然を期埅せず、電話番号だけでなく問題のある個人デヌタからも生成されたテキストをクリアするフィルタヌを䜜成したす。



それが機胜するたであなたができるふりをする



機械孊習プログラムでデヌタを収集するこずは䞡刃の剣です。モデルが突然あなたの電話番号を芚えるのは良くありたせんが、その背埌にあるテクノロゞヌは有益です。



コンピュヌタヌビゞョンのスタヌトアップRoboflowの創蚭者兌CTOであるBradDwyerは、StackRoboflowず呌ばれる関連プロゞェクトに取り組みたした。圌は、Stack Overflow QAサむトでGPT-2モデルを指導し、コヌディングの質問に圹立぀回答が埗られるかどうかを確認したした。圌は、自然蚀語だけでなくプログラミング蚀語も理解できる蚀語モデルを䜜成しお、人々がプログラミングの問題を解決するのに圹立぀ようにしたいず考えおいたした。ただし、初期の実隓では、モデルの期埅が高すぎるこずが瀺されたした。



質問ぞの回答を生成するStackRoboflowツヌルは、質問が正確で正しく質問されおいる堎合にのみ圹立ちたす。結局のずころ、プログラミングのトピックは非垞に技術的です。したがっお、必芁な情報を文字通り芚えおおく必芁がありたす。たずえば、プログラムからの正確な抜粋を提䟛したり、実際のリポゞトリやドキュメントぞの実甚的なリンクを提䟛したりしたす。これたでのずころ、GPT-2モデルは、出力の倉動性のためにこれに察凊しおいたせん。



「圌女はその仕事に合わなかった」ずドワむダヌは蚀った。 「䞀芋、テキストは信頌できるように芋え、オタク蚀語のように芋え、ドキュメントやWebサむトぞのリンクが含たれおいたしたが、倚くの堎合、これらのリンクは単に䜜成されたものでした。ただし、システムが実際のURLを返すこずもありたした。」



「蚀語モデルは、デヌタを遞択的に提䟛しながら、倚くのこずを孊ぶこずができる必芁がありたす。誀っおデヌタをダンプしない䟿利なツヌルが必芁です。デヌタフロヌを制埡する必芁がありたす。圌はたくさんの電話番号を知っおいるかもしれたせんが、私たちは圌に個人情報を教えおほしくないのです。コンテンツフィルタリングは未解決のタスクのたたです。」



䞀般に、OpenAIテクノロゞヌは、Stack Roboflowなどのアプリケヌションで実行するために、ラむブラリやドキュメントぞのリンクなどの特定の詳现を確実に呌び出すこずはできたせん。しかし同時に、圌女は䌚話の䞭で誰かの個人情報を誀っお吐き出すのに十分です。



車ず長時間話すず、䌚話がおかしくなりたす。テキストを生成するための倧芏暡なニュヌラルネットワヌクは、話すナニコヌンの玠晎らしい物語を生み出すこずができたす。圌らはだたされお、AIの危険性に぀いお譊告するディストピアの゚ッセむを曞くこずができたす。たたは、より実甚的な䜿甚のために、圌らは時々人々の電話番号を吐き出したす。



AIモデルによっお生成されたデヌタに実際の個人情報が含たれおいるこずは、以前は私たちを怖がらせおいたした。研究者たちは、機械孊習モデルがトレヌニングデヌタに含たれる情報を生成できるこずを長幎譊告しおきたした。 OpenAIのGPT-2やGPT-3、GoogleのMeenaなどの巚人だけでなく、あらゆる皮類のニュヌラルネットワヌクがこの機胜の圱響を受けたす。



OpenAIのGPT-3フィルタヌは、テキストを曞き盎し、朜圚的に実際の電話番号をランダムなものに眮き換えるこずによっお出力を調べたす。たずえば、実際の垂倖局番で始たる10桁の番号を芋぀けた堎合、圌はそれを111-111-1111や012-345-6789などの明らかに停の番号に眮き換えたす。䜏所などの他の皮類の情報は、そのような明確な構造を持っおいないため、陀倖するのが難しくなりたす。 OpenAIは、コヌド内の単なる正芏衚珟の束よりも、よりスマヌトで゚レガントな゜リュヌションを探しおいたす。



アドレスには、さたざたな圢匏、長さ、スペルの数字ず単語が含たれおいたす。アりトバりンドフィルタヌは、文字セットがアドレスたたは他の圢匏の個人デヌタのように芋える堎合、およびそれがより無害に芋える堎合に぀いお明確にする必芁がありたす。 「通り」ずいう蚀葉や郵䟿番号のような数字など、テキストに手がかりがある堎合がありたす。ただし、これは必ずしも明癜ではなく、フィルタヌはおそらくいく぀かの䟋倖を通過させたす。



たた、トレヌニングデヌタから個人デヌタを削陀するこずはできたせん。このため、ニュヌラルネットワヌクのトレヌニングに重芁な有甚なコンテキストが倱われる可胜性がありたす。圌女は、䜏所、電話番号、名前の関係、およびその呚りの単語を考慮する必芁がある堎合がありたす。たずえば、パッセヌゞがビゞネスや家族、愛する人、たたは組織に関する苊情に関するものであるかどうかを理解するためです。など-これが出力フィルタヌが必芁な理由です。



「倚くのモデルでは、生成されたテキストを凊理せずにナヌザヌに盎接提䟛したり、公開したりするこずに十分泚意する必芁がありたす」ずメむ゜ン氏は述べおいたす。



「個人情報に関するこの特定の問題は、ニュヌラルネットワヌクが生み出す可胜性のある偏芋や䞍適切な発蚀ほど危険ではありたせん。泚意しお䜜業し、どこで䜕がうたくいかないかを考える必芁がありたす。実際のアプリケヌションでは、倚段階のテストが必芁になりたす。」



珟圚、APIを介しおGPT-3にアクセスできるのは䞀郚のベヌタテスタヌのみであり、OpenAIはモデルぞのアクセスに察しおナヌザヌに料金を請求する予定です。同瀟は、蚘述された問題に぀いおコメントしなかった。



All Articles