Amazonの評価やレビューがあてにならないことがある、というのはみなさんご存じかと思います。
それは、サクラレビューがあるからですね。
悪質な販売者が、自分の売っている商品をほめるレビューを書くようレビュアーにお金を出しているのです。こうして書かれるのがサクラレビュー。
製造しやすいもの、たとえばイヤホンなどは、売っているものの6割以上にサクラレビューが書かれている*1そうです。
昔はそういうサクラはあやしい日本語を書いていたのですぐわかりましたが、最近は日本語ネイティブやAIが書いているものもあるので、文章だけ見てもサクラ判定は難しいのが現状です。
Unsplash- Photo ByTowfiqu barbhuiya
サクラチェッカー
が、これを無料で自動判定してくれるサイトがあります。
ここでサクラ度が低い(つまり、販売者がズルをしていない)と判定された商品をいくつも買ってみたのですが、実感としては、やっぱり価格がちょっと高いのですが、届く商品がどれもちゃんとしているんですよね。サクラなんかを使わない販売者の商品はやっぱりまともだということなんでしょう。
なので、私はAmazonで買い物をするときは、基本このサイトを通しています(本などは別として)。とても助かっています。
明確すぎる日本語は不自然
で、ここからが本題。
AIの書く日本語には指示語や接続語が多い
このサイトがどうやってサクラを判定しているのか、サイト運営者さんご自身が解説したページを読んでいて、興味深い記述を見つけました。
最近は、AIにサクラレビューを書かせるケースも増えているそうで、AIが書いた日本語の特徴が書かれています*2。
そこに書かれている特徴は次のとおり。
何度も「この」を使って明確にしようとしたり、接続語をしつこく使って話の流れを分かりやすくしたり、レビューではあまり見ない非常に丁寧な日本語を使う特徴からAIレビューの可能性を判断できます。
つまり、言葉の指す対象を明確にしすぎたり話の流れをわかりやすくしすぎると、一般的な日本語として不自然になる、ということなんです。
明確さや話の流れのわかりやすさはコミュニケーションにおいてとても重要な要素ですが、日本語はそれをやりすぎないのがむしろ普通、ということですね。
ほんとうにそうか:外国語との比較
これは感覚としてはよくわかりますが、念のため裏付けもとってみます。
総務省によると、AIの研究をリードしているのはアメリカと中国*3。なので上記の指摘について、英語と日本語、日本語と中国語の差がどうなっているのかを確認してみます。
英語と日本語の違い(指示語の頻度)
英語については、英文添削会社・フルーツフルイングリッシュ・リミテッド社のサイトにこんな記事がありました。
英語における代名詞は、日本語に訳す場合、「私に」「彼は」「彼女の」「あれ」「それ」など、指示語になるケースがほとんどです。日本語にはこうした指示語を多用することがないので、気を付けていないと訳文の不自然さにつながります。
そこでおすすめなのが、「訳文では指示語を少なめにする」ことです。つまり、指示語の多様(ママ)を避け、必要であれば省略することで、日本語としての読みやすさを狙います。
引用元:【翻訳家になるには】指示語に注意して、自然な和訳に! | Fruitful Englishのおいしいブログ~英語の暮らし
英語を日本語に訳すときには、指示語を少なめにすると自然になる。そういうアドバイスがはっきり書かれています。
中国語と日本語の違い(接続詞の頻度)
中国語については、に次の記載がありました。
中国語母語話者 >韓国語母語話者 >日本語母語話者の順で接続詞の使用が多く(以下略)
引用元:金蘭美「YNU書き言葉コーパスに見られる日本語学習者の接続詞の使用について」(横浜国大国語研究, 35, p. 79-93, 2017-03-20)
中国語ネイティブは日本語ネイティブに比べ接続詞を多く使う傾向があることが書かれています。
以上から、サクラチェッカーのAIサクラ判定方法の裏付けはある程度とれたのかなと思っています。
まとめ
日本語で明確でわかりやすい流れの文章を書くことはできるが、そうすると読む人が違和感を感じることがある。これは自分が前から感じていたことですが、それがサクラレビューの判定方法という思わぬところに書かれていたので、おもしろいなと思ってメモをとった次第です。
関連メモ
西洋人と東洋人の考え方の違いと、それが生じる理由は言語なのでは?という研究結果を紹介。例:英語は「主語優位型」言語。"It's raining."というだけでも主語が必要。日本語、中国語、韓国語は「話題優位型」言語。文のなかには、「話題」が占めるべき位置(一般には文頭)がある。