音声認識
[No.11] AIで高性能スパムフィルターを開発、言語モデルGPT-2がスパムを生成しアルゴリズムを教育
2021年6月11日
セキュリティの国際会議RSA Conference 2021(#RSAC)が2021年5月、バーチャルで開催された。
今年は、AIを活用したセキュリティ技術に注目が集まり、多くのソリューションが登場した。
[No.10] Microsoftは話し言葉でプログラミングできる技法を公開、OpenAIと共同で大規模AIの開発を加速
2021年6月4日
Microsoftは2021年5月、話し言葉でプログラミングできる技術を公開した。エンジニアが言葉で指示すると、AIはこれをプログラム言語に変換する。このAIは「GPT-3」と呼ばれ、言葉を理解する言語モデルで、OpenAIにより開発された。
[No.8] Googleのチャットボットは人間より会話が上手い!!これからの検索エンジンは対話型AIに向かう
2021年5月21日
Googleは開発者会議「Google I/O」を開催し講演をライブビデオで配信した。基調講演ではCEOのSundar Pichaiが研究開発の最新成果を幅広く紹介した。話題はAI、検索技術、モバイル、コラボレーション、量子コンピュータ、クリーンエネルギーと多岐にわたった。この中でもAIに重点が置かれ、会話型AIであるチャットボットの研究でブレークスルーを達成した。
[No.7] Voice Cloning 誰でもプロのアナウンサーになれる、AIが発言者の音声を編集し言い間違いを修正する
2021年5月14日
アマチュアがNHKのアナウンサーのように流ちょうに喋るビデオを生成できる。ビデオの制作で時間がかかるのがナレーションの録音と編集である。準備したテキストに従って喋るが、アマチュアの場合、言い間違いやテキストの修正で撮影を繰り返し、ファイナルカットができるまで時間を要す。
[No.5] Synthetic Media 誰でも簡単に高精度なデジタル・ヒューマンを生成できる、アインシュタインがよみがえりピザを販売する
2021年4月30日
Synthetic Media(シンセティック・メディア)が新聞やスマホに次ぐ三世代のメディアとなる。
Synthetic Mediaとは、AIで生成された動画や音声を指し、誰でも簡単にプロ並みのコンテンツを生成できることに特徴がある。