カテゴリーアーカイブ 研究紹介

投稿者:山本研究室

特定選手に注目した試合結果記事見出しのパーソナライズ

概要

本研究では,試合結果記事における特定選手に注目した見出しを生成する手法を提案する.見出しの生成には T5 という文生成モデルを用いる.記事全文を入力として,T5 に見出しの最初の文字を注目している選手名にする制約をかけた単純な手法では,注目していない選手の活躍を,注目している選手の活躍のように見出し生成してしまうという問題がある.そこで我々は,試合結果記事から記事の主題に関する文,注目している選手の活躍に関する文のみを抽出して,T5 に入力する手法を提案する.このアプローチにより,指定した選手に注目した自然で事実に基づいた見出しを生成させる.評価実験により,提案手法は,記事全文を入力する単純な手法よりも,特定選手に注目した見出し生成の精度が良いことが示された.

書誌情報

佐々木泰河, 工家昂之, 山本岳洋, 莊司慶行: 特定選手に注目した試合結果記事見出しのパーソナライズ, 第16回データ工学と情報マネジメントに関するフォーラム(DEIM2024), T1-B-6-04, 2024年3月.

スライド

投稿者:山本研究室

文章間類似性判定モデルの根拠の抽出

概要

本研究では,2 つの文の類似性を判定し,「類似」「非類似」という判定の根拠となる文節の抽出に取り組む. まず,類似度が与えられた 2 つの文章ペアのデータに,類似度に応じて「類似」または「非類似」というラベルを付与し,「類似」「非類似」を判定する BERT モデルを作成した.その後,各文を文節に分割し,文節の類似度が高い順に各文から 1 文節ずつを取り出した文節ペアを作成した.最後に,文節ペアをそれぞれマスクした状態で学習した BERT に入力し,類似に分類される確率をマスク前と比較することにより,変化の大きい文節ペアを判定に影響を
与える根拠として抽出した.その結果,類似文からは類似度の高い文節を共通語として,非類似文からは類似度は高くないものの対応関係を持つ文節を差異として抽出することができた.また,誤分類に影響を与えた文節を抽出することにより,誤って学習している部分や学習が不十分であった部分を発見した.

書誌情報

中井香那子, 河田 友香, 山本 岳洋: 文章間類似性判定モデルの根拠の抽出, 第16回データ工学と情報マネジメントに関するフォーラム(DEIM2024) ,T1-A-4-02, 2024年3月

投稿者:山本研究室

大規模言語モデルを用いたその場での要約に基づくレビュー探索インタフェース

概要

本研究では,類似する商品レビューについて,大規模言語モデルを用いた要約をユーザに提示するシステムを提案する.たとえばドライヤーをインターネットで購入するときに「髪の毛がつやつやになりました!」というレビューを見て,類似する観点のレビューを探したくなるというように文章を読んで調べたい観点が思い浮かぶことがある.しかし,従来の検索手法である文字列マッチングでは,類義語を用いたレビューを検索することができないうえ,検索キーワードとして適切な単語がないという問題がある.そこで,商品レビューから抜粋した文章を入力とし,分散表現を用いて類似すると判定した商品レビューについて要約を行い,提示するシステムを提案する.大規模言語モデルを用いることにより,ドメインに縛られずに要約を行い,同じ観点のレビューを分かりやすく提示できると考えた.提案手法についてユーザ実験を行い,観点や意見の網羅性や結果の見やすさについてアンケートをとった結果,従来の文字列マッチングよりも回答者平均が上回り,結果の見やすさについては有意差が認められた.また,レビューの検索精度についても評価したところ,提案手法ではフレーズで検索を行ったときに文字列マッチングを用いた手法より F1 値が高くなった.今後はユーザ実験の人数を増やし,プロンプトの改善を行っていく必要がある.

書誌情報

藤井真梨乃, 河田 友香, 山本 岳洋: 大規模言語モデルを用いたその場での要約に基づくレビュー探索インタフェース, 第16回データ工学と情報マネジメントに関するフォーラム (DEIM2024) , T3-B-5-04 , 2024年3月

投稿者:山本研究室

音声会話型検索エージェントにおける多様な情報獲得を促すための観点推薦タイミングに関する研究

概要

1.観点推薦が多様な情報獲得の支援に貢献するのか,2.観点推薦のタイミングが多様な情報獲得をするユーザの検索行動にどのような影響を与えるか,という2つのリサーチクエスションを明らかにする研究.
観点推薦なしのインターフェース,クエリ応答後即時に観点推薦するインターフェース,ユーザが悩んだタイミングで観点推薦するインターフェースの3つのインタフェースで観点推薦を行い,実験参加者に与える影響を分析する.

書誌情報

飛岡憲, 山本岳洋: 音声会話型検索エージェントにおける多様な情報を促すための観点推薦タイミングに関する研究, 第15回データ工学と情報マネジメントに関するフォーラム(DEIM2023), 3a-9-5, 2023年3月.

スライド

投稿者:山本研究室

手続き的知識源を用いた方法を表すクエリからの目的抽出

概要

ある目的の達成方法は複数存在するが,一般的にこれらすべての達成方法を知っていることは稀で,既存の検索システムでは意図的に知ることはできない.そこで,ユーザの入力よりユーザの目的を考慮し,ユーザが知らない方法を提示するために,方法を表すクエリから目的を抽出する手法を提案する.本研究では,文生成モデルを用いて,ユーザの入力よりその目的を生成することで目的の抽出に取り組む.

書誌情報

工家 昂之、山本 岳洋、莊司 慶行: 手続き的知識源を用いた方法を表すクエリからの目的抽出, 第15回データ工学と情報マネジメントに関するフォーラム(DEIM2023), 3a-7-3, 2023年3月.