投稿者アーカイブ 山本研究室

投稿者:山本研究室

D1飛岡憲さんの論文がSIGIR-AP 2024に採録されました

情報検索に関する国際会議である2nd International ACM SIGIR Conference on Information Retrieval in the Asia Pacific (SIGIR-AP 2024)にD1の飛岡憲さんの論文が採録されました。

  • Ken Tobioka, Takehiro Yamamoto and Hiroaki Ohshima: Timing of Aspect Suggestion to Encourage Diverse Information Acquisition in Spoken Conversational Search, SIGIR-AP 2024, December 2024.

2024年12月に東京で発表予定です。

投稿者:山本研究室

ERDSE2024にて3名が発表しました

2024年7月2日(火)長良川国際会議場で行われたThe 29th International Conference on Database Systems for Advanced Applications (DASFAA 2024)の併設ワークショップであるThe DASFAA 2024 Workshop on Emerging Results in Data Science and Engineering (ERDSE2024)で山本研究室のメンバー3名が発表しました。

  • Taiga Sasaki, Takehiro Yamamoto, Yoshiyuki Shoji, Takayuki Kuge, Hiroaki Ohshima: “Generating News Headline Containing Specific Person Name”, The DASFAA 2024 Workshop on Emerging Results in Data Science and Engineering (ERDSE 2024), July 2024.
  • Kanako Nakai, Yuka Kawada, Takehiro Yamamoto, Hiroaki Ohshima: “Investigating Evidence in Sentence Similarity using MASK in BERT”, The DASFAA 2024 Workshop on Emerging Results in Data Science and Engineering (ERDSE 2024), July 2024.
  • Marino Fujii, Yuka Kawada, Takehiro Yamamoto, Takayuki Yumoto: “Review Search Interface Based on Search Result Summarization Using Large Language Model”, The DASFAA 2024 Workshop on Emerging Results in Data Science and Engineering (ERDSE 2024), July 2024.

皆さんお疲れ様でした。

投稿者:山本研究室

研究室歓迎会を行いました

4/18に創作ダイニングうたげにて歓迎会を行いました。

新しいメンバーと一緒にみんなで楽しくおいしい料理を食べました。



1年間このメンバーで頑張って研究を行っていきたいと思います。

イベント係の皆さん、ありがとうございました。

投稿者:山本研究室

特定選手に注目した試合結果記事見出しのパーソナライズ

概要

本研究では,試合結果記事における特定選手に注目した見出しを生成する手法を提案する.見出しの生成には T5 という文生成モデルを用いる.記事全文を入力として,T5 に見出しの最初の文字を注目している選手名にする制約をかけた単純な手法では,注目していない選手の活躍を,注目している選手の活躍のように見出し生成してしまうという問題がある.そこで我々は,試合結果記事から記事の主題に関する文,注目している選手の活躍に関する文のみを抽出して,T5 に入力する手法を提案する.このアプローチにより,指定した選手に注目した自然で事実に基づいた見出しを生成させる.評価実験により,提案手法は,記事全文を入力する単純な手法よりも,特定選手に注目した見出し生成の精度が良いことが示された.

書誌情報

佐々木泰河, 工家昂之, 山本岳洋, 莊司慶行: 特定選手に注目した試合結果記事見出しのパーソナライズ, 第16回データ工学と情報マネジメントに関するフォーラム(DEIM2024), T1-B-6-04, 2024年3月.

スライド

投稿者:山本研究室

文章間類似性判定モデルの根拠の抽出

概要

本研究では,2 つの文の類似性を判定し,「類似」「非類似」という判定の根拠となる文節の抽出に取り組む. まず,類似度が与えられた 2 つの文章ペアのデータに,類似度に応じて「類似」または「非類似」というラベルを付与し,「類似」「非類似」を判定する BERT モデルを作成した.その後,各文を文節に分割し,文節の類似度が高い順に各文から 1 文節ずつを取り出した文節ペアを作成した.最後に,文節ペアをそれぞれマスクした状態で学習した BERT に入力し,類似に分類される確率をマスク前と比較することにより,変化の大きい文節ペアを判定に影響を
与える根拠として抽出した.その結果,類似文からは類似度の高い文節を共通語として,非類似文からは類似度は高くないものの対応関係を持つ文節を差異として抽出することができた.また,誤分類に影響を与えた文節を抽出することにより,誤って学習している部分や学習が不十分であった部分を発見した.

書誌情報

中井香那子, 河田 友香, 山本 岳洋: 文章間類似性判定モデルの根拠の抽出, 第16回データ工学と情報マネジメントに関するフォーラム(DEIM2024) ,T1-A-4-02, 2024年3月