投稿者アーカイブ 山本研究室

投稿者:山本研究室

文章間類似性判定モデルの根拠の抽出

概要

本研究では,2 つの文の類似性を判定し,「類似」「非類似」という判定の根拠となる文節の抽出に取り組む. まず,類似度が与えられた 2 つの文章ペアのデータに,類似度に応じて「類似」または「非類似」というラベルを付与し,「類似」「非類似」を判定する BERT モデルを作成した.その後,各文を文節に分割し,文節の類似度が高い順に各文から 1 文節ずつを取り出した文節ペアを作成した.最後に,文節ペアをそれぞれマスクした状態で学習した BERT に入力し,類似に分類される確率をマスク前と比較することにより,変化の大きい文節ペアを判定に影響を
与える根拠として抽出した.その結果,類似文からは類似度の高い文節を共通語として,非類似文からは類似度は高くないものの対応関係を持つ文節を差異として抽出することができた.また,誤分類に影響を与えた文節を抽出することにより,誤って学習している部分や学習が不十分であった部分を発見した.

書誌情報

中井香那子, 河田 友香, 山本 岳洋: 文章間類似性判定モデルの根拠の抽出, 第16回データ工学と情報マネジメントに関するフォーラム(DEIM2024) ,T1-A-4-02, 2024年3月

投稿者:山本研究室

大規模言語モデルを用いたその場での要約に基づくレビュー探索インタフェース

概要

本研究では,類似する商品レビューについて,大規模言語モデルを用いた要約をユーザに提示するシステムを提案する.たとえばドライヤーをインターネットで購入するときに「髪の毛がつやつやになりました!」というレビューを見て,類似する観点のレビューを探したくなるというように文章を読んで調べたい観点が思い浮かぶことがある.しかし,従来の検索手法である文字列マッチングでは,類義語を用いたレビューを検索することができないうえ,検索キーワードとして適切な単語がないという問題がある.そこで,商品レビューから抜粋した文章を入力とし,分散表現を用いて類似すると判定した商品レビューについて要約を行い,提示するシステムを提案する.大規模言語モデルを用いることにより,ドメインに縛られずに要約を行い,同じ観点のレビューを分かりやすく提示できると考えた.提案手法についてユーザ実験を行い,観点や意見の網羅性や結果の見やすさについてアンケートをとった結果,従来の文字列マッチングよりも回答者平均が上回り,結果の見やすさについては有意差が認められた.また,レビューの検索精度についても評価したところ,提案手法ではフレーズで検索を行ったときに文字列マッチングを用いた手法より F1 値が高くなった.今後はユーザ実験の人数を増やし,プロンプトの改善を行っていく必要がある.

書誌情報

藤井真梨乃, 河田 友香, 山本 岳洋: 大規模言語モデルを用いたその場での要約に基づくレビュー探索インタフェース, 第16回データ工学と情報マネジメントに関するフォーラム (DEIM2024) , T3-B-5-04 , 2024年3月

投稿者:山本研究室

研究室追いコンを行いました

2023年3月25日に追いコンを行いました。

M2 3名、B4 2名が卒業生として旅立ちました。

卒業生の皆さんに、今までの感謝の気持ちを込めた記念品と寄せ書きを贈呈しました。

卒業生の皆さん、ありがとうございました。

卒業後も新たな場所で頑張ってください!

時々研究室にも遊びに来てください!

 

イベント係の皆さん、企画ありがとうございました。

投稿者:山本研究室

DEIM2024にて7名が発表しました

2024年2月28日から3月5日にかけてアクリエ姫路にて開催された第16回データ工学と情報マネジメントに関するフォーラム(DEIM2024)で、山本研究室のメンバー7名が発表しました。

  • 佐々木 泰河, 工家 昂之, 山本 岳洋, 莊司 慶行: 特定選手に注目した試合結果記事見出しのパーソナライズ, 第16回データ工学と情報マネジメントに関するフォーラム(DEIM2024), T1-B-6-04, 2024年3月.
  • 中井 香那子, 河田 友香, 山本 岳洋: 文章間類似性判定モデルの根拠の抽出, 第16回データ工学と情報マネジメントに関するフォーラム(DEIM2024), T1-A-4-02, 2024年3月.
  • 平位 遼, 飛岡 憲, 山本 岳洋: 音声対話型検索における階層型検索意図を用いたクエリ推薦の戦略, 第16回データ工学と情報マネジメントに関するフォーラム(DEIM2024), T3-B-2-03, 2024年3月.
  • 藤井 真梨乃, 河田 友香, 山本 岳洋: 大規模言語モデルを用いたその場での要約に基づくレビュー探索インタフェース, 第16回データ工学と情報マネジメントに関するフォーラム(DEIM2024), T3-B-5-04, 2024年3月.
  • 河田 友香, 山本 岳洋, 大島 裕明, 藤田 澄男: 追加事前学習によるレビューと商品属性の対応関係学習, 第16回データ工学と情報マネジメントに関するフォーラム(DEIM2024), T3-A-5-04, 2024年3月.
  • 工家 昂之, 山本 岳洋, 莊司 慶行: 手続き的知識源学習によるタスク検索における方法と目的の生成, 第16回データ工学と情報マネジメントに関するフォーラム(DEIM2024), T3-C-8-04, 2024年3月.
  • 前田 直宏, 山本 岳洋: 生成型要約に基づくWebページのサムネイル生成, 第16回データ工学と情報マネジメントに関するフォーラム(DEIM2024), T3-B-4-03, 2024年3月.

また、佐々木 泰河さん、中井 香那子さん、藤井 真梨乃さん、河田 友香さんが学生プレゼンテーション賞を受賞しました。

みなさん、お疲れさまでした。

投稿者:山本研究室

研究室忘年会をしました

12月21日に研究室の忘年会を行いました。

2023年最後を楽しく締めくくることができました。

2023年1年間お疲れさまでした。

イベント係の皆さんありがとうございました。