コロナ禍によって、社会のデジタル化、スマート化が一気に進行しました。その中核を担うものが「AI(人工知能)」。機械化や自動化の有用性を多くの人々が実感したことで、AIの導入、活用は凄まじい勢いで加速しています。
そんなAIにおいて、東京大学発のAIベンチャー・株式会社ELYZAから国内初の日本語文章執筆AI 「ELYZA Pencil」が登場しました。
株式会社ELYZAは、AI研究の第一人者として知られる松尾豊先生(東京大学大学院工学系研究科人工物工学研究センター・技術経営戦略学専攻 教授)が主宰する研究室、通称・松尾研の在学生・卒業生を中心としたメンバーで構成されており、AIによる技術革新、社会実装に取り組んでいます。
ELYZA Pencilは、独自の大規模言語AIによって、キーワードを数個入力するだけで、なんと約6秒で文章を生成。ホワイトカラー業務の軽減とDX推進を目指して一般公開されたデモサイトでは、ニュース記事、ビジネス用のメール、職務経歴書を 生成することができます。
わずか6秒で執筆完了とは! どれだけすごいのか、さっそく仕事で頻繁に使うビジネスメールの生成を試してみました。2〜8個のキーワードを入力すると文章を生成してくれるようなので、希望も込めて「仕事」「依頼」「お礼」と入力。あっという間に画像のようなメールが完成しました。
ビジネスメールのマナーを遵守し、こちらの意欲も示しています。想像以上の高精度に、近い将来、ライターに取って代わる存在になるかもしれないと不安を感じる一方、その優れた文章生成力の仕組みを知りたくなり、 株式会社ELYZAに取材を依頼。松尾研の修士課程に在籍し、ELYZA PencilのAI開発責任者を務める平川雅人さんにお話をうかがうことができました。
お話を伺った平川雅人さん
AI研究のスペシャリストがビジネスの煩わしさ解消に着目
まず、平川さんに質問したのは、ELYZA Pencilの仕組みについてです。AIが学習していることは漠然とわかるのですが、どのように文章生成力をマスターさせていくのでしょうか。
「ELYZA Pencilは、私たち独自の自然言語処理技術によって機能しています。自然言語処理とは、人間の言語(自然言語)を機械が解析し処理する技術です。自然言語処理AIにはディープラーニング(深層学習)という技術を使用しており、大量の日本語のテキストを学習させています。ディープラーニングは2012年頃から画像処理分野で目覚ましく発展してきたのですが、Googleが2018年に発表した大規模言語モデルが人間を超える精度を達成したことで、自然言語処理分野でもブレイクスルーが起きました。以降、自然言語処理は急速に進展し、私たちもさまざまな研究開発や共同開発プロジェクトを通して、より自然で、より流暢な文章生成を実現しています」
では、ELYZA Pencilがビジネスユースに特化した理由は何だったのでしょう。
「弊社では、高精度にテキストを扱うAIにより実現可能となった新しい働き方、サービスについて、同じ熱意を持って社会実装を推進してくださるパートナーと共に、事業プランを構築するプログラムを展開していました。そこで、日々の業務には文章を書くという作業が無数に存在し、負担やストレスになっているとの声をキャッチしました。こういったホワイトカラー業務の軽減、代替が可能となれば、本来の業務、クリエイティブなタスクに注力できます。つまり、ビジネスシーンでの業務効率化において、文章生成AIは間違いなくニーズがあると思い、研究開発しました」
一通のメールを打つにしても、内容や相手によって書き方を考える必要があり、意外に手間も時間もかかります。職務経歴書も自らの行く末を決定づけるものですから、いかにアピールするか、逆に誇大表現になっていないか、細部まで気になるはず。ニュース記事も何を書こうか、どうすれば読んでもらえるか推敲しなければなりません。こういった文章書く面倒をAIがまかなってくれると助かりますよね。
サンプルキーワード「お寿司」「焼肉」「ピザ」「特別な日」を使用して作成したニュース記事
サンプルキーワード「東京大学」「修士課程」「AI研究」「ELYZA」を使用して作成した職務経歴書
とはいえ、ぎこちない文章では、人間の代替の業務も成立しません。また、表現が多彩な日本語のディープラーニング、文章生成はかなり難しいのではと、想像してしまうのですが。
「日本語の多様性は、確かに難しさもありますが、言語的な難易度よりも、質が高い言語データを十分な量用意できるかの方が重要であることが多いです。研究開発では、ユーザーの意図を反映させながらも、タスクに応じて適切な文章をAIに生成させるために、言語データの量と質にはとことんこだわりました。当然ですが、差別的、暴力的表現は排除。正しい文法、なめらかな文体なども追究しましたね」
量と質が文章生成AIの鍵。日本語に比べると、英語は膨大なデータが存在していることから、英語のAIの研究、実装化が進んでいるとのこと。平川さんたちは学習用データを収集・加工する社内のデータ専門チームと連携をとることで、データ面でのハンデを克服しつつ、英語圏における研究の知見も取り入れながら日本語の文章生成AIの改善に取り組んでいます。
結果、ELYZA Pencilのデモサイトの評判は上々。生成速度が速いことや、生成された文章を執筆のベースにできることはもちろん、正しい表現の確認や違う表現の模索にも使えることが支持されています。また日本語、日本人らしいへりくだった表現の生成も可能であるため、筆者もフォーマルなメールを送付する前のマナーの確認や表現のチョイスができ、「失礼のないメール文ができた」という安心感も得られました。
固すぎず柔らかすぎず、エッセンスの利いた文章に
もうひとつ、興味をそそられたのがELYZA Pencilの豊富な知識と“想像力”です。
例えば、ニュース記事で筆者が応援している某プロ野球チームと本拠地名を入力すると、「何十年も優勝から遠ざかっている」といった情報が盛り込まれていてびっくり。メールでは、具体的なキーワードは入力せずに、お詫び、猛省とだけ入力すると、「社員の不祥事」といった、新聞の三面記事やサスペンス小説ばりの謝罪メールができあがりました。
「大変失礼ながら、いろいろなワードを入れて楽しんでしまいました」と伝えると、「デモサイトの一般公開は、私たちの自然言語処理技術が社会実装可能なレベルであることを実感・体感いただくことはもちろん、普段AIなどの技術に触れる機会があまりない方にも楽しく試していただくことも目的だったので」と、和やかに応じてくださった平川さん。
「キーワードを並べただけの文章では面白くないのですが、人が意図していないことまで肉付けしては実務の文章執筆では使えません。忠実すぎず、必要以上のものを構成しすぎず、それでいて書く人のアイデアやヒントになるような文章を生成できることが私たちが工夫した点であり、ELYZA Pencilの強みです」
人間が書きたい、AIに書かせたい文章を生成するという指令や、ビジネスマナー、フォーマットにのっとりながらELYZA Pencilが独自に思考し、エッセンスを添えることができるとは。一方で、時代も言葉も日々進化していくもの。今日のニュースは明日になれば過去の出来事となり、流行語はあっという間に死語になってしまいます。
「AIは、新しい情報や言葉をどんどん学習し、過去のデータを蓄積していきます。そのため、試していただいたようなスポーツの過去のデータを盛り込んだりもできますが、例えば日本の総理大臣は誰ですか?という質問に対して、現総理ではなく元総理を答えてしまうケースがあるように、時系列性などの文脈を考慮して一般常識を扱うことは現在のAIが苦手としているタスクです。過去を含め大量のデータをより的確に活用させるには、さらに研究開発が必要ですね」と、平川さんはいいます。
AIをもっと身近に。頼れる、使える存在に
現在はデモンストレーションサイトのみの一般公開ですが、今後、本格的にELYZA Pencilの導入・定着が進めば、全国民のホワイトカラー業務の10%以上を代替できる可能性があるとし、文章生成の領域の拡大も目指していくと平川さんは展望を語ります。
「ライターはじめ文章を書く職業に向けては、AIが文章のベースを代わりに作成することから、類語や表現のパターン、アイデアを複数提示するようなことも実現が可能だと思います。自然言語処理技術が人間に迫るレベルにまで向上しているとはいえ、どんなコンセプトで文章を執筆するのか、何を伝えたいのかは、人間が考え行うタスクです。今後は、煩わしい文章生成はAIに、クリエイティブな部分は人間にと、役割が変わってくるでしょう」
取材中の余談として平川さんがお話くださったのですが、Googleのあるエンジニアが日々AIに向き合う中で「AIに意思が宿った、意識が芽生えた」と語り、それに対して専門家からは「AIは感性や知性を持ち得ることはない」と批判が殺到するなど物議を醸したそうです。ただ、今回、筆者はELYZA Pencilを使ってみて、まるでこちらの心の内をくみ取っているかのように文章を生成してくれるなと感じました。AIそのものに心はなくても、気持ちのこもったコミュニケーションを補助してくれる役割には大いに期待できそう。人間の仕事や役割を奪う脅威の存在ではなく、共に働く良きパートナーとして、共存共栄していければいいですね。