音声認識

[No.11] AIで高性能スパムフィルターを開発、言語モデルGPT-2がスパムを生成しアルゴリズムを教育

2021年6月11日

セキュリティの国際会議RSA Conference 2021(#RSAC)が2021年5月、バーチャルで開催された。
今年は、AIを活用したセキュリティ技術に注目が集まり、多くのソリューションが登場した。

GAFAM

[No.10] Microsoftは話し言葉でプログラミングできる技法を公開、OpenAIと共同で大規模AIの開発を加速

2021年6月4日

Microsoftは2021年5月、話し言葉でプログラミングできる技術を公開した。エンジニアが言葉で指示すると、AIはこれをプログラム言語に変換する。このAIは「GPT-3」と呼ばれ、言葉を理解する言語モデルで、OpenAIにより開発された。

GAFAM

[No.8] Googleのチャットボットは人間より会話が上手い！！これからの検索エンジンは対話型AIに向かう

2021年5月21日

Googleは開発者会議「Google I/O」を開催し講演をライブビデオで配信した。基調講演ではCEOのSundar Pichaiが研究開発の最新成果を幅広く紹介した。話題はAI、検索技術、モバイル、コラボレーション、量子コンピュータ、クリーンエネルギーと多岐にわたった。この中でもAIに重点が置かれ、会話型AIであるチャットボットの研究でブレークスルーを達成した。

音声認識

[No.7] Voice Cloning 誰でもプロのアナウンサーになれる、AIが発言者の音声を編集し言い間違いを修正する

2021年5月14日

アマチュアがNHKのアナウンサーのように流ちょうに喋るビデオを生成できる。ビデオの制作で時間がかかるのがナレーションの録音と編集である。準備したテキストに従って喋るが、アマチュアの場合、言い間違いやテキストの修正で撮影を繰り返し、ファイナルカットができるまで時間を要す。

音声認識

[No.5] Synthetic Media 誰でも簡単に高精度なデジタル・ヒューマンを生成できる、アインシュタインがよみがえりピザを販売する

2021年4月30日

Synthetic Media（シンセティック・メディア）が新聞やスマホに次ぐ三世代のメディアとなる。
Synthetic Mediaとは、AIで生成された動画や音声を指し、誰でも簡単にプロ並みのコンテンツを生成できることに特徴がある。