音声認識

音声認識
[No.11] AIで高性能スパムフィルターを開発、言語モデルGPT-2がスパムを生成しアルゴリズムを教育

セキュリティの国際会議RSA Conference 2021(#RSAC)が2021年5月、バーチャルで開催された。
​今年は、AIを活用したセキュリティ技術に注目が集まり、多くのソリューションが登場した。

続きを読む
GAFAM
[No.10] Microsoftは話し言葉でプログラミングできる技法を公開、OpenAIと共同で大規模AIの開発を加速

Microsoftは2021年5月、話し言葉でプログラミングできる技術を公開した。エンジニアが言葉で指示すると、AIはこれをプログラム言語に変換する。このAIは「GPT-3」と呼ばれ、言葉を理解する言語モデルで、OpenAIにより開発された。​

続きを読む
GAFAM
[No.8] Googleのチャットボットは人間より会話が上手い!!これからの検索エンジンは対話型AIに向かう

Googleは開発者会議「Google I/O」を開催し講演をライブビデオで配信した。​基調講演ではCEOのSundar Pichaiが研究開発の最新成果を幅広く紹介した。話題はAI、検索技術、モバイル、コラボレーション、量子コンピュータ、クリーンエネルギーと多岐にわたった。この中でもAIに重点が置かれ、会話型AIであるチャットボットの研究でブレークスルーを達成した。

続きを読む
音声認識
[No.7] Voice Cloning 誰でもプロのアナウンサーになれる、AIが発言者の音声を編集し言い間違いを修正する

アマチュアがNHKのアナウンサーのように流ちょうに喋るビデオを生成できる。​ビデオの制作で時間がかかるのがナレーションの録音と編集である。準備したテキストに従って喋るが、アマチュアの場合、言い間違いやテキストの修正で撮影を繰り返し、ファイナルカットができるまで時間を要す。

続きを読む
音声認識
[No.5] Synthetic Media 誰でも簡単に高精度なデジタル・ヒューマンを生成できる、アインシュタインがよみがえりピザを販売する

Synthetic Media(シンセティック・メディア)が新聞やスマホに次ぐ三世代のメディアとなる。
Synthetic Mediaとは、AIで生成された動画や音声を指し、誰でも簡単にプロ並みのコンテンツを生成できることに特徴がある。

続きを読む