ブログ

Brandwatch Searchの裏にある科学とは?【インタビュー】

※ブレインパッドはBrandwatchの国内正規パートナーであり、本記事はBrandwatch(イギリス)の許可を得て翻訳転載しています。翻訳元
 
Phill Agnewが最新機能の背景にある科学についてBrandwatchのチーフ・データ・サイエンティストにインタビューします。

【Brandwatch Search】いくつかの印象的な機能が搭載


Google検索と同じように、ユーザーは検索したいエンティティ(ブランド、人物、イベントなど)を入力すると、Brandwatchが自動的に検索候補を提案してくれるのです。

最初に使ってみたとき、私は魅了されました。クエリを書くのに何百時間も費やしてきた者として、これが私とクライアントの時間を大幅に節約してくれることがすぐにわかりました。

この素晴らしいアップデートの背後にある科学についてもっと知りたいと思い、その背後にあるブレーンであるBrandwatchのチーフデータサイエンティストであるAykut Firat氏に話を聞きに行きました。ここでは、私たちの議論を紹介します。
 

 

 
 

まずはAykutさんの経歴について教えてください。

現在、Brandwatchでチーフデータサイエンティストをしています。ディープラーニング技術を用いたNLPと画像処理の問題に取り組んでいます。以前は、インテリジェントな情報統合、進化的計算、AIに焦点を当てたスタートアップ企業で働いていましたが、その中にはMITで博士号を取得していた時に私のアドバイザーと共同で設立した企業も含まれています。

Searchでは実体の曖昧性解消と呼ばれるものを使用しています それは何ですか?

エンティティの曖昧性解消は、テキスト中のエンティティを抽出し、曖昧性のないナレッジベースのエンティティにリンクさせます。私たちの場合、このナレッジベースはウィキペディアです。
本質的には、オンラインで行われている何十億もの異なる会話を理解し、それらをエンティティにグループ化することができます。ところで、エンティティとは、ブランド、人物、イベントから、サイクリングやサイバーセキュリティのような幅広いトピックまで、何でもあります。

エンティティの曖昧性解消はどのような問題を解決するのでしょうか?

Brandwatchで曖昧な概念を検索するのは難しいです。会社のAppleを検索しても、アップルパイについてなど望ましくない結果が表示される場合もあります。エンティティ曖昧性解消機能により、不要な結果を減らしたり、排除したりすることで、必要なエンティティのみを収集します。

そして、エンティティの曖昧性の解消は実際にはどのように機能するのでしょうか?

ユーザーの視点から見ると、リストから関心のあるエンティティを選択するのと同じくらい簡単で、結果を得ることができます。

 

 

 




技術的には、4つの主要なコンポーネントがあります。

 

 

 

1.テキストの単位でエンティティを指すことができる単語やフレーズを抽出
2.テキストの文脈を利用して、これらの単語やフレーズを特徴と関連付ける
3.ナレッジベースのエンティティを文脈に沿った特徴と関連付ける
4.そして、それらを検索に一致させる

具体的な例を教えていただけますか?

“Blackberryは安全性に関するものであり、Appleはユーザーエクスペリエンスに関するものである”という言及について考えてみましょう。

私たちは、BlackberryとAppleを、ウィキペディアの中の実体を指し示す関心のある言葉として識別します。人間にとっては、「安全性」と「ユーザーエクスペリエンス」は、この文脈についての手がかりを与えてくれます。
同様に、当社の特許出願中のAIベースの曖昧性解消エンジンは、与えられたテキストに表示されている以上の意味を自動的に抽出します。そのため、当社のAIは、「slam dunk」という言葉が「Michael Jordan」と関連していることを、同じ記事の中で2つの用語が言及されていなくても認識することができます。
もしあなたがApple社やApple phoneを検索している場合、保存されているエンティティと入力テキストの機能はほとんどの場合一致し、上記のテキストが結果として返されます。

つまり、通常のクエリライティングの改善だと主張できるのですね?

通常のクエリライティングでは、(Phone OR iPhone OR Mac OR ….)のように、余分な用語を使って文脈を追加しようとすることがよくあります。このプロセスは非常に弱く、不完全で、時には不可能な場合もあります。

例えば、”to “や所有格の “my “のような一般的な前置詞を使うと、”I like to drive to Malibu “と “I like to drive my Malibu “のように、場所と車を区別することができます。ほとんどの人は、クエリを書くときにこのような用語を含めるのに苦労しますが、検索を使えば、スマートなAIがそれを代行してくれます。

多くの場合、人間が作成したクエリと比較した場合、より多くの項目がマッチし、より正確にマッチする可能性が高いため、通常のクエリを書く際に大きな改善になるでしょう。

ユーザーがSearchを利用する際に注意すべきことは何ですか?

ユーザーが注意すべき点がいくつかあります。SearchはBrandwatchの新しい技術革新であり、まだ開発中です。

つまり、近い将来に多くのアップデートが行われることを期待する必要がありますが、すぐに完璧になるとは思ってはいけません。Searchは、エンティティによっては他のエンティティよりも優れた機能を発揮します。

例えば、同じ単語で参照されている類似のブランドが2つある場合、システムはより多くの間違いを犯す可能性があります。競合する意味の文脈が離れている場合は、結果がより正確になります。また、現在のところ、Searchのエンティティの曖昧性解消は英語に基づいていることにも注意が必要です。

そして最後に、Searchの今後は?

私たちは、アップデートを提供するために努力しています。今、私たちが注目している大きなことは、英語よりも多くの言語でエンティティの曖昧性解消を実現することです。

ブログチームと話す時間を取ってくれたAykutに感謝します。

 
 
 

 

 

マーケティングリサーチツールBrandwatchについて

・機能紹介
・利用シーン
・事例

関連記事

・ソーシャルリスニングならTwitter?Facebook?注目すべきSNSとは
・10年分のソーシャルメディアデータから導く10の考察
・ソーシャルリスニングとは?概要や方法について
 

 

Brandwatchは
Twitter社のオフィシャルパートナーです。

ブレインパッドが導入から
運用まで支援します

  • 使い方を支援

    使い方を
    支援

  • ナレッジを共有

    ナレッジを
    共有

  • 分析・運用を支援

    分析・運用を
    支援