人工知能が日本語を読んで評価

よくGoogleの「アルゴリズム」という言葉が使われます。これは簡単にいえば、Googleの人工知能の判断基準ということです。そして、Googleの人工知能が何をするかというと、ひたすらWEB上に書かれた文章を読み、評価を付けています。
例えば、「この文章は●●というキーワードでは●点。●●というキーワードでは●点」といった具合です。点数をつける基準はいろいろあります。「独自性」「日本語としての正しさ」「読みやすさ」「結論部分の見つけやすさ」などでしょう。この基準と点数の付け方が、アルゴリズムです。

国語の先生の添削

つまり、Googleのアルゴリズムとは、学校の国語の先生による添削みたいなもんだといえるでしょう。したがって、「悪文」には悪い点数をつけます。

悪文とは

悪文とは、何が言いたいのか分からない文章のことです。その典型が、長すぎる文です。文章は短ければ短いほうが良いというのが、大原則。どこの作文教室に行っても、そう教えています。

長い文

Googleの人工知能も、「長い文章はダメだ」と考えています。主語と述語が入れ子のようになっている文章には低評価をつけるでしょう。また、結論が何だか分からない文章もダメ出しされるでしょう。
国語でも習うように、起承転結みたいなルールが大事です。全体としての論理展開ができていないと、そのサイトは落第点となります。

言語学者たちの入れ知恵

人間でもないGoogleが、どうして日本語の良し悪しを判断できるかというと、それは、言語学者ら専門家がそういうプログラムをロボットに叩き込んでいるから、というのが一つです。

自己学習機能

しかし、それ以上に大事なことは、Googleの人工知能ロボットの「自己学習機能」です。Googleの人口機能は、「どういう文章が良い文章なのか」を日々自分で学び続けています。
例えば、「仮想通貨」というキーワードの検索において、現在の検索結果にユーザーがどのような反応を示し、どのような検索上のリアクションを起こすかを把握します。
それを元に、どの文章(サイト)が良くて、どの文章(サイト)が悪いのかを判断し、次回の検索結果に活かしていくのです。これを無限に繰り返すことで、アルゴリズムとしての「日本語の判定基準」に磨きをかけています。
つまり、1日に何億回ものフィードバックを行うことで、どんな言語学者や文学作家よりも優れた「添削能力」を身に着けているのです。国語力の世界コンテストがあれば、Googleの人工知能が優勝するでしょう。人間が人工知能にかなわない状況は、囲碁やチェスの世界と同じです。

同じような文章はいらない

Googleが、日本語の教師として私たちに突きつける課題は他にもあります。それは、「独創性を発揮しろ」ということです。

存在意義が必要

似たような文章がたくさんあって、それを検索結果に並べられても、ユーザーにはメリットがありません。既存の文章よりも、より具体的であったり、より分かりやすかったり、情報が新しかったり、丁寧だったり、何らかのプラスの特性が必要です。いわば存在意義が必要なのです。

オリジナル認定

同じような文章がたくさんあれば、その中からもっとも古いものがオリジナルとして認定され、それが一番上に来ます。そして、それ以外は、はるか下のほうに表示されていればいいということになります。

誘導性や閲覧性も加味

また、作られた時期に大きな差がなければ、結論や大事な情報に容易に誘導(ナビゲート)されやすいサイトが上位に選ばれるでしょう。
そういった誘導性や閲覧性も含めて上手に得点がつけられるのが、GoogleのAIのすごいところです。

技術偏重の人はSEOに向いていない

「コンテンツが大事」は真実

Googleは公式見解として「SEOにはコンテンツが一番大事だ」と繰り返してきました。 これは、はったりでもキレイごとでもありません。本当にそうなのです。以前はハッタリだったかも知れません。でも、Googleの人工知能が発達した今、彼らのアルゴリズムは人間よりもコンテンツの良さを上手に判断できる能力を備えています。
ということは、SEOというものは、コンテンツに優れた見識を持つ人が主導すべきだということです。技術に偏重しすぎる人がSEOを指揮すると、失敗します。
「バックリンクがうんぬん」とか「サーバーがうんぬん」といった技術的な問題は、二次的なものです。こうした技術的なことを専門にする人たちは、コンテンツリーダーの意見に耳を傾け、黒子としてサポートする役に徹したほうが良いでしょう。