自然言語処理

テキストベクトル検索モデルを低リソースで学習するために

はじめに こんにちは! 株式会社ユーザベース スピーダ事業の飯田です。 普段はベクトル検索用の埋め込みモデルの学習及びデプロイを行っています。 大きなモデルを低リソースで学習する手法としてQLoRAとFSDPが広く用いられています。 この記事では、Senten…

言語モデルLUKEを経済の知識に特化させたモデル「UBKE-LUKE」の提案

株式会社ユーザベースでUB Researchを担当している高山です。 ユーザベースでは2023年7月からStudio Ousia社と業務提携して、自然言語処理の研究開発に取り組んでいます。今回はその取り組みの一つとして作った言語モデルについて書いていきます。 概要 経済…

LLMの日本語化はベクトル表現にも有効か?LLM2Vecにおける日本語ドメイン適応の効果

はじめに こんにちは! 株式会社ユーザベース スピーダ事業部の飯田です。 この記事では、テキストをベクトルに変換(エンコード)にLLMを用いる際に有効なLLM2Vecという手法を紹介します。 合わせて、LLM2Vecにおける日本語ドメイン適応として、LLM2Vecの処…

Page top