Toreru Media は【毎週火曜日】+α で更新!

機械翻訳 VS 人間 ~特許翻訳のプロが見たホンネの機械翻訳~

 前回の記事で、弁理士さんをはじめとする技術文書に関わる方に「村上春樹のように文章を書いてほしい」とお願いしました。

でも、あんなお願いをしてよかったのかな、と自問しています。実は、あのお願いをするには、とんでもなく勇気が要りました。

村上春樹のような「平易な文章」が主流になれば、翻訳しやすくなる。でも、翻訳者は仕事が楽になってラッキー!と楽観的ではいられません。焦ります。めちゃくちゃ焦ります。

なぜでしょうか?

それは、ここ数年の翻訳業界で1番ホットな話題、「機械翻訳(Machine Translation: MT)」「AI翻訳」に関連します。

今回は、特許翻訳歴17年の私が機械翻訳をどう考えているのか、そのホンネをお話したいと思います。

ゲストライター紹介
み・カミーノさん:特許翻訳歴16年のフリーランス翻訳者&ときどきライター。おもに通信・情報、電気・電子、機械分野の明細書を英語に翻訳しています。ライフワークは書くこと、ゴスペル、国際交流。仕事の話、日々の気づき、エッセイなどをnote (https://note.com/bousuku_keyman)に書いています。

1.  機械翻訳とはナニモノなのか?

Google翻訳がすっかり定着し、いまでは多くの人が機械翻訳の「経験アリ」でしょう。ほんの10年ほど前まで、機械翻訳は実務では使いものにならないレベルでした。

ところが、2014年の「ニューラル機械翻訳」の登場により、様相が変わります。2016年、Googleがディープラーニングを使ったニューラル機械翻訳サービスをスタート。2017年には、ドイツのDeepL GmbHが「DeepL翻訳」をスタートさせました。

その後、機械翻訳は翻訳業界にも進出します。私のいる特許翻訳の現場でも機械翻訳案件は2016年ころから急増し、その流れはとどまるところを知りません。

2020年に特許庁が発行したレポート「令和2年度 特許出願技術動向調査 結果概要 機械翻訳」には、以下のように書かれています。

グローバル市場調査会社の Bizwit Research & Consulting によると、世界の機械翻訳市場は2016 年に4.35 億ドルであり、2017 年〜2025 年にかけて年平均14.60%で成長すると予測されている。

また、翻訳業界で有名な翻訳支援ツール「Memsource」を提供するMemsource社(本社:チェコ共和国)は、2017年に日本の100社以上と契約していたそうです。

なぜ、機械翻訳はこんなにも増えたのでしょうか?

それは、もちろんコスト削減のため。人間が最初から翻訳する「ゼロイチ翻訳」よりも、機械翻訳にかけたあとの文章を人間がチェックしたほうがスピーディなうえ、コストを抑えられるからです。

2.  「平易な文章」は機械翻訳との相性がバツグン

前回の記事で述べたような「平易な文章」は、翻訳しやすい文章です。翻訳分野にもよりますが、「平易な文章」を現在の機械翻訳にかければ、そこそこの英文をつくれる可能性は高いです。

これは由々しき事態。イチ翻訳者として、「平易な文章」が主流になればいいなぁ、などと吞気なことは言っていられません。

めちゃめちゃ焦ります。「平易な文章」が普及するのはマズイじゃないですか。みんなが「平易な文章」を書くようになれば、機械翻訳の独壇場になりかねません。

機械翻訳の精度が上がれば、翻訳を発注するクライアントはこんなふうに思うはずです。

“機械翻訳を使ってそれなりにOKの英文ができるなら、翻訳者は必要ないんじゃない?”

“翻訳の専門職じゃなくても、英語の文法チェックができる人がすればいいでしょ”

“翻訳者に依頼するとコスト高いしね”

コストも削減でき、早く仕上がるなら機械翻訳、という流れなんでしょう。でも、翻訳の品質についてはどう考えているのでしょうか。

 翻訳者は文字だけを訳すのではなく、原文を読み込み、内容を理解してから翻訳します。一方、機械翻訳は、大量の対訳データからある一定の規則性を学習し、翻訳しています。文脈をふまえて訳したり、言葉の裏にあるものを読みとって訳したりということは、現時点の機械翻訳ではまだ難しい。

とはいえ、ここ1、2年の機械翻訳の向上には目をみはるものがあります。私の経験をもとにいうと、数年前の機械翻訳は単純な文法ミスや前置詞の間違いなどが多く、修正すべき箇所ばかりでした。ところが、最近の機械翻訳では単純なミスはかなり減りました。

そのかわり、トリッキーなミスが目につくようになりました。つまり、文字だけをサッと読んでいたらミスだと気づかないような、そんな間違いです。原文の意図を汲み、文章の内容をきちんと把握しなければ、そういったミスを見のがす危険性があります。

いいかえれば、チェックする翻訳者が原文の本質や内容をどれだけ理解しているか、翻訳者の質がより問われる時代がやってきたと感じています。 

3.  特許翻訳が機械翻訳と相性がいいのはなぜか?

機械翻訳は、翻訳業界全体で増えています。取扱説明書や契約書などは、機械翻訳に適した分野。特許翻訳も、機械翻訳との相性がいいと言われています。その理由は以下のとおりです。

①   特許明細書には「型」がある

特許明細書には特定の様式があり、書くべき事項が決まっています。

第三節 明細書の作成方法(特許庁HP 出願の手続より)

  • 発明の名称
  • 技術分野
  • 背景技術
  • 先行技術文献
  • 発明の概要
  • 発明が解決しようとする課題
  • 課題を解決するための手段
  • 発明の効果
  • 図面の簡単な説明
  • 発明を実施するための形態
  • 産業上の利用可能性
  • 符号の説明
  • 特許請求の範囲
  • 要約書
  • 図面

各セクションで、論理の組み立てかたはある程度決まっています。明細書の中身は発明の内容によって違いますが、型のない文書よりも、型のある文書のほうが機械翻訳となじみがいいのは言うまでもありません。

②   定型文が多い

特許明細書には、定型文や決まり文句があります。決まったフレーズの翻訳は、機械翻訳の得意とするところです。

③   特許公報データが膨大にある

どの国の特許制度もそうですが、特許庁に出願された特許明細書は、原則として出願日から1年6か月経過後にその内容が一般に公開されます。公開された情報は、だれでも無料でネットでのアクセスが可能。つまり、大量の特許明細書の対訳データをネット上でサーチできるのです。それらの対訳データは、機械翻訳の学習データとして使われています。

機械翻訳の実例を見てみよう

ここで、実際の機械翻訳の例を挙げてみます。いまやGoogle翻訳よりもはるかに精度が高いといわれる「DeepL翻訳」の無料版を使い、実際の特許明細書で使われるような文章をいくつか訳してみます。

「背景技術」のセクション

原文:従来、フラッシュメモリが内蔵されたカード型の記録媒体であるSDカード等の半導体記憶装置は、超小型、超薄型である。その取り扱いやすさから、デジタルカメラ、携帯機器等において画像等のデータを記録するために広く利用されている。

DeepL翻訳:世界一高精度な翻訳ツールより

 

「発明を実施するための形態」のセクション

原文:ノズルボディ30は、有底の略中空円筒状に形成されており、このノズルボディ30の略中央にニードル20が収容されている。これらノズルボディ30の内周面30aとニードル20の外周面20aとの間に燃料流路50が形成されている。

DeepL翻訳:世界一高精度な翻訳ツールより

 

特許翻訳者の私からみると、両方とも、英文明細書の表現としていくつか修正すべき点はあるものの、文法や用語などのミスはありません。無料版の「DeepL翻訳」でさえ、このレベルです。有料版で高精度の機械翻訳を使えば、もっと品質の高い翻訳ができあがるのは容易に想像できます。

しかし、特許明細書の最も重要な部分であり、「特許の心臓」ともいうべき「特許請求の範囲」は、機械翻訳ではまだ到底太刀打ちできません。人間による「ゼロイチ翻訳」が必要です。「特許請求の範囲」とは、たとえば以下のような文章です。

【請求項1】

  提供側として設定された場合に設定情報を送信し、取得側として設定された場合に前記設定情報を受信する通信装置であって、

  他の前記通信装置に接続される通信部と、

  他の前記通信装置と接続された場合に、当該他の前記通信装置と同一のネットワークに属する一意の識別情報を前記通信部に設定する識別情報設定部と、

  前記提供側又は前記取得側として設定する指示を受け付ける指示受付部と、

  前記指示により前記取得側として設定された場合に、前記ネットワークに対しマルチキャストにより前記設定情報の要求を表す取得要求を当該取得側の前記識別情報と共に送信する取得要求送信部と、

  前記指示により前記取得側として設定された場合に、前記提供側の前記通信装置から前記取得要求に応じて提供される前記設定情報を取得する設定情報取得部と

  を具えることを特徴とする通信装置。

特開2022-056075より)

この「特許請求の範囲」を「DeepL翻訳」の無料版で訳してみました。

A communication device that transmits configuration information when configured as a provider and receives said configuration information when configured as an acquirer, and

  A communication unit that is connected to other communication devices, and

  When the communication device is connected to another communication device, an identification information setting unit that sets unique identification information belonging to the same network as the other communication device in the communication unit; and

  The instruction receiving unit accepts an instruction to set as the provider side or the acquiring side.

  When the acquiring side is set as the acquiring side by the instruction, the acquiring request transmitting unit sends an acquisition request expressing a request for the setting information to the network by multicast together with the identification information of the acquiring side.

  When the acquiring side is set as the acquiring side by the instruction, the acquiring side acquires the setting information provided in response to the acquisition request from the communication device of the providing side.

  The communication device is characterized in that it has the following features

DeepL翻訳:世界一高精度な翻訳ツールより

「特許請求の範囲」は、文章というより1つの「名詞」です。その1つの名詞を修飾するために、複数の句や節を並べます。また、その中で使われる句点「。」は1つ、と規定されています。

上の例でいうと、発明の対象である「通信装置」が、どんな通信装置であるのかという特徴が書かれており、句点「。」は最後に1つあるだけです。

「DeepL翻訳」の結果を見てみると、外国特許庁に出願する特許請求の範囲としての規定を満たしていません。途中に句点「。」が3つもあり、分断されています。また、和文ではそれぞれの名詞句(通信部、識別情報設定部など)の関係性が明らかですが、「DeepL翻訳」の結果ではそれらの関係性は明確ではありません。

このように「特許請求の範囲」の翻訳は、現在の機械翻訳ではイマイチな結果となるため、人間による「ゼロイチ翻訳」が必要なのです。

4.  翻訳者が機械翻訳を使いたくない本当の理由とは?

機械翻訳案件は増えるいっぽうですが、多くの翻訳者は機械翻訳を進んでやりたい、とは思っていません。特に、中堅からベテランの翻訳者であればあるほど「機械翻訳をできれば使いたくない」と思っています。これは翻訳者同士の話でもよく聞くし、私自身もそう思っています。

機械翻訳の依頼ばかりでイヤになり、別の翻訳会社にのりかえた翻訳者もいます。機械翻訳の影響は当分ないといわれる分野に、転向する翻訳者もいます。一方、機械翻訳の依頼はうなぎのぼり。転向しない多くの翻訳者もモヤモヤを抱えたまま受注しているのが現実です。

では、なぜ翻訳者は機械翻訳をやりたくないのでしょうか?

それには、いくつかの理由があります。

1つ目の理由は、機械翻訳は「ゼロイチ翻訳」と比べ、文字単価が安いことです。一概にはいえませんが、機械翻訳は30%くらい文字単価が安い印象です。

2つ目の理由は、機械翻訳の文章を修正するだけのいわゆる“ポスト・エディット”は単なる作業のように感じられ、手ごたえがありません。

実際、機械翻訳で出力された文章を修正する作業では、自分の思うように訳せないため、クリエイティビティを感じられません。

一方、機械翻訳をまったく使わない「ゼロイチ翻訳」の場合、翻訳者は自分の頭で考えて翻訳します。そこには、文章を生み出す喜びと楽しさがあり、やりがいがあります。私もそうですが、翻訳を仕事にしている人はもともと英語好きで、自分でじっくり考えて訳したいという職人気質の人が多いように思います。

でも、これらの理由は、翻訳者が機械翻訳を使いたくないメインの理由ではありません。

最大の理由はコレです。

機械翻訳を使うと自分の翻訳力が落ちる”という危機感があるから。

これはどういうことなのでしょうか。

ここでは、だれもが経験したことのある、日常の1コマを例に説明します。

なじみのない土地で、ある場所に行くことになりました。あなたはどうしますか?

たいていの人は、Googleマップなどの地図アプリを使って道順をチェックするはずです。アプリが、目的地までの道を案内してくれます。自分の頭を使う必要はありません。あなたは、そのアプリが示すとおりの道順で進めばいい。まわりの景色をチェックしなくても、目印を探さなくても、アプリがどこの角で曲がればいいのか、何メートルくらい進むのか、すべて指示してくれます。あなたは自発的に行動する必要はありません。アプリからの指示を待っていればいいだけです。

そのあいだ、あなたの脳はフル回転しているでしょうか?

では、地図アプリなどを使わずに、自分の力だけで目的地に行く場合を考えてみます。

まず、あなたは道順をおぼえなくてはいけません。目的地までの道沿いにある目印をチェックし、交差点の名前を1つ1つ確認します。どれくらい時間がかかるのか、時計も見るはずです。どこで曲がるのか、どれくらいの距離を進むのか、あなたは常に自分で考え、判断します。自発的に行動しなければ、目的地にたどり着けないからです。

そのあいだ、あなたの脳はフル回転しています。

つまり、先の例のように地図アプリを使えば、あなたは考える必要はありません。自分の脳を使う機会を、あなたは自分で奪っているのです。

積極的に脳を使わなければ、脳はどんどん衰える。これはよく知られていること。

これと同じようなことが、機械翻訳にもあてはまります。機械翻訳は、翻訳者が自発的に脳を使う機会を奪います。機械翻訳の出力を修正するだけの作業(さきほどの“ポスト・エディット”)では、ずっと培ってきた翻訳スキルを活かせないのです。どんな分野でも、スキルは使わなければ衰えていきます。

つまり、“機械翻訳を使うと自分の翻訳力が落ちる”という危機感を抱いている。これが、翻訳者が機械翻訳を使いたくない、最大の理由なのです。

5.  機械翻訳の登場により、翻訳者は「どう働くか」の決断を迫られている

残念ながら、機械翻訳がなくなることは考えられません。その現実をふまえ、翻訳者は今後どう働くのか、覚悟を決めるときだと思います。

私が思うに、大半の翻訳者は「機械翻訳とは無縁にやり続ける」と「機械翻訳を積極的にとりいれていく」との中間にいます。どちらにも振り切れない。私自身もそうです。

翻訳者は、今後、大きく分けて次の2つのように棲み分けていくだろうと思います。

  1. 翻訳業界以外の人にも名が知れ渡るくらいの有名な翻訳者、一点ものの翻訳をする職人のような翻訳者、ニッチな分野で機械翻訳やAIが翻訳できないものを訳す翻訳者
  2. 機械翻訳と共存する「ポスト・エディター」としての翻訳者

翻訳者は、機械翻訳を使うのか、使わないのかの決断を迫られています。残念ながら、この2つを同時に習得するのは無理です。なぜなら、機械翻訳の出力を修正しながら訳す“ポストエディット”に慣れてしまうと、翻訳スキルが落ち、「ゼロイチ翻訳」はできなくなると考えられるからです。

6.  あなたも同じような危機を感じているはず

特許翻訳歴17年の私が「機械翻訳」をどう考えているのか、そのホンネをお話しました。いま翻訳業界で起きていることは、どの業界にも、どの分野にもあてはまることではないでしょうか。

だれもが、AIの少なからぬ影響を感じているはず。医療、法曹、金融、広告、デザインなど、幅広い分野で危機感を抱いている人は多いと思います。

知財業界でも、特許明細書を自動で作成するツール「AI Samurai」や「Specifio」が登場しています。これらにどれだけ信憑性があり、実際どれだけ使えるツールなのかは未知数です。しかし、これらツールの登場により、特許明細書をゼロイチで作る時代、というのは少しずつ終わりに近づいているのかもしれません。

AIが進歩すればするほど、仕事は変化していく、それが現実です。個人レベルで、これからの働きかたを考える必要があります。

また、企業レベルでは「AIを使うべきところに使う」ことに力を尽くしてほしいと思います。どこにでも、なんにでもAIを使えばいいという姿勢ではなく、適材適所の視点を忘れずにいてもらいたい。心からそう願います。

Toreru 公式Twitterアカウントをフォローすると、新着記事情報などが受け取れます!

押さえておきたい商標登録の基本はコチラ!