これは熱い!機械学習搭載でGoogle翻訳の精度が向上。

img_57cad45d83284

Google翻訳の精度が上がったらしいよ。今話題の機械学習を取り入れたんだってさ。人類の夢の1つである「ほんやくコンニャク」完成に、また1歩近づいたようだ。今日はそんな夢のあるお話。

統計的手法から機械学習へ。

さて、具体的には何が変わったんだろう。どうやら、最近よく耳にする「機械学習」や「ニューラルネットワーク」がキーワードらしい。技術的なことはよくわからないので、ボロが出ないように言及は避けておきます(苦笑)

Google翻訳では今まで,統計的なデータを使って翻訳していたものを,機械学習を使った翻訳にシステムを切り替えたわけですね.
(引用:Google翻訳,ニューラルネットワークが導入されて精度が大幅上昇

そういえば、現時点では日本語から英語への翻訳は対応しているけれど、英語から日本語は対応してないという話もあった。とはいえ多くの人が精度向上に驚いていて、何かしら大きな変化が起こったのは間違いないようだ。

統計データだろうが機械学習だろうか、そんなことは大事じゃない。大切なのは、実用に耐えられるかどうかでしょう。さっそく試してみよう。

テストについて。

サンプルとして使わせてもらうのは「海外の有名ミニマリストからも高評価の『20/20ルール』が良い感じ」で紹介した「Ms. Simplicity: Use the 20/20 rule to tackle clutter」という記事。2箇所を引用し、翻訳結果について調査してみる。

1つだけ注意点。Google翻訳の翻訳結果として新旧の2つを載せている。旧翻訳についてはChromeにて右グリックメニューから選択できる「日本語に翻訳」で得られた結果を、新翻訳については「Google翻訳」にコピペして得られた結果を掲載している。なぜかよくわからないけど、僕の環境では得られる結果が違う。また後者のほうが明らかに精度が高い。なので仮想的に、これらを新旧として比較しているよ。

ではさっそくやってみましょう。

テスト1

原文

原文はこちら。

The rule is simple—if you can replace something for less than $20 in less than 20 minutes, you can get rid of it.

旧Google翻訳

これを以前のGoogle検索で翻訳すると、こんな感じ。

ルールは20分未満未満$ 20のために何かを置き換えることができ、あなたはそれを取り除くことができれば単純です。

…あぁ懐かしい。これだよ、これ。学生時代は英語の論文を読むこともあったけれど、翻訳サイトはほとんど使ったことがない。だってほとんど役に立たないんだもん。

新Google翻訳

さて、今回新しくなった翻訳ではどうなるか。

ルールは簡単です。20分以内に20ドル未満のものを置き換えることができれば、それを取り除くことができます。

おぉ!! 旧翻訳と全然違うじゃん。とりあえず日本語としてはだいぶきれいだよね~。すごい。これはなかなかに熱い(`・ω・´)!!

意訳

参考に僕の意訳も載せておくよ。意味を取り違えてたらごめんね。

そのルールはシンプルだ。もしあなたが20ドル以下で、20分以内に何か代用品を用意できるのであれば、あなたはそれを処分することができる。

新Google翻訳と比較してどうだろう。微妙にニュアンスが怪しいけれど、ある程度意味が取れてるよね。

テスト2

原文

もう1つ、別の部分を引用してテストしてみるね。今度はちょっと長いよ。

Books: Some of us love our books more than our children, and we will not part with them, while others are ready to start parting with them. Remember, we have great resources like public libraries and swapping with friends to meet our 20/20 rule. Knowing these free resources are nearby can give comfort in shedding books.

旧Google翻訳

旧翻訳ではどうなる。おそるおそる結果をみてみましょう。

洋書:他の人が彼らと別れを開始する準備ができている間、私たちの一部は、私たちの子供たちよりも私たちの本以上を愛し、そして我々は彼らとの一部ではないでしょう。覚えておいてください、私たちは私たちの20/20ルールを満たすために、友達と公共図書館とスワッピングのような偉大なリソースを持っています。これらの空きリソースが近くにいる知っていることは本を流しに安心感を与えることができます。

うぅ、やっぱり旧Google翻訳では厳しい。わかりそうな気がするのに、なぜか何も頭に入ってこない。

新Google翻訳

さて、期待の新Google翻訳。こんな長文でも、すばらしい結果を見せてくれるのでしょうか。

本:私たちの一部は私たちの子供たちよりも私たちの本を愛し、私たちは彼らと付き合いませんが、他の人は彼らと別れる準備ができています。 20世紀のルールを満たすためには、公立図書館や友人との交換のような素晴らしいリソースがあることを覚えておいてください。これらの無料のリソースが近くにあることを知ることは、書籍を流すことで慰めを与えることができます。

んー、ちょっと苦しいか。それでも意味はある程度取れる。冒頭の「私たちの一部は私たちの子供たちよりも私たちの本を愛し」だけでも読む価値があるよね。この付近にどういうことが書かれているかを推測できるから。

旧翻訳もほとんど同じ訳をしてるけど、肝心の最後の部分で「…私たちの本以上を愛し」とよくわからない表現になっている。やはり旧翻訳と比べると精度の向上は疑いようがない事実だね~。

でも新Google翻訳では、20/20ルールを「20世紀のルール」と完全に誤訳してしまってるね。その点、旧翻訳ではそのまま「20/20ルール」として残ってる。翻訳が賢くなると、こういうことも起こっちゃうという良い例かもしれない。

意訳

こちらも参考に、僕の適当な意訳を載せておきます。

書籍:書籍を手放す覚悟がある人もいるが、中には子ども以上に書籍を愛する人たちもいて、決してそれを手放そうとしない。でも20/20ルールを思い出して欲しい。わたしたちは図書館や友人との交換などを考慮すれば、莫大なリソースを持っているんだ。これらの無料で使えるリソースを知ることで、書籍を捨てられるようになるはずだ。

ごめん。これ、冷静に読み直すと相当無理な訳をしてるね。「to meet our 20/20 rule」の部分がよくわからず、無理やり日本語を組み立てた感がすごい(´・ω・`)汗

…なんてことに気づかされ、改めて新Google翻訳の実力を思い知らされた。

該当の部分だけに限定すれば、旧翻訳も「20/20ルールを満たすために」ときれいに訳してくれている。でも全体的に日本語が汚くて、真面目に読もうとは思えないんだよね。新翻訳は意味があってるかどうかはともかく、比較的日本語はきれいだから、それなりに読める。これは非常に大きな違いだと思う。

まとめ。

以前のGoogle翻訳は、正直使い物にならなかった。だから今まで、ほとんど使った記憶がない。しかし今回の改善で、大幅に翻訳精度が向上したのは間違いなさそうだ。旧Google翻訳の信頼度が20%程度なら、新翻訳は50~60%くらいになるのだろうか。

信頼度が20%なら読むだけ無駄だったけど、50%を超えてくるのなら話は変わってくる。じっくり読む前にさらっと読んでおくと、概要がつかめそう。それだけでも利用価値があるよね。この先もどんどん翻訳精度は上がっていくんだろう。英語が得意ではない僕にとっては、非常にうれしいニュース。今後が楽しみだね(`・ω・´)!

あ、でも中学生や高校生は、こういうのにはあまり頼っちゃダメだよ? こういうのを使いこなすためにも、英語の基本はきちんと学んでおきましょうね。…うん、わかってる。僕も偉そうなことを言える立場じゃないね(苦笑)

以上、ゆとり隊長でした(๑•̀ㅂ•́)و✧

関連記事:「海外の有名ミニマリストからも高評価の『20/20ルール』が良い感じ」「大学受験のスタートダッシュとしてオススメしたい「基礎固め参考書」まとめ!!

 


PAGE TOP