最終更新日: 2025/03/03
Kaito Sugimoto (杉本 海人)
GitHub (id: kaisugi) / Google Scholar (id: 4-9oJ_IAAAAJ) / LinkedIn (id: kaisugi)
機械学習等の先端技術が持つ価値を社会に広く届けることに関心があります。
職務経験
エヌ・ティ・ティ・コミュニケーションズ株式会社(株式会社NTTドコモより出向)
2023/04/01 -
ソフトウェアエンジニア / リサーチエンジニア → プロダクトオーナー
ハードスキル
ソフトウェアエンジニアとして:
- Python, JavaScript, TypeScript, C#, C++, Rust
- React/Redux, Next.js, Django, .NET
- PyTorch, Hugging Face Transformers
- Google Cloud
- Kubernetes
- Terraform
- GitHub Actions
- Agile, Scrum
データサイエンティストとして:
- 大規模言語モデル(LLM)(好き)
- 自然言語処理, テキストマイニング(やや得意〜得意)
- 時系列分析(普通)
資格
- Google Cloud Certified Professional Cloud Architect
- Google Cloud Certified Professional Cloud Developer
- Google Cloud Certified Associate Cloud Engineer
- 基本情報技術者
- 応用情報技術者
- 統計検定2級
- 日商簿記検定試験3級
- 3級ファイナンシャル・プランニング技能士
学歴
東京大学大学院 情報理工学系研究科 コンピュータ科学専攻
2021/04/01 - 2023/03/31
修士(情報理工学)
東京大学 理学部 情報科学科
2019/04/01 - 2021/03/31
学士(理学)
東京大学 理科一類
2017/04/01 - 2019/03/31
論文
Refereed
- Kaito Sugimoto, Akiko Aizawa. 2022. Incorporating the Rhetoric of Scientific Language into Sentence Embeddings using Phrase-guided Distant Supervision and Metric Learning. Proceedings of the Third Workshop on Scholarly Document Processing (SDP 2022). [PDF]
- Kaito Sugimoto, Akiko Aizawa. 2021. Context-aware Citation Recommendation Based on BERT-based Bi-Ranker. 2nd Workshop on Natural Language Processing for Scientific Text (SciNLP 2021).
Non-Refereed
- 新井一博, 松井遼太, 深山健司, 山本雄大, 杉本海人, 岩瀬義昌. 2025. chakoshi: カテゴリのカスタマイズが可能な日本語に強いLLM向けガードレール. 言語処理学会第31回年次大会 (NLP 2025). [PDF]
- 丹野良介, 坂本悠記, 中村耀, 杉本海人, 切通恵介. 2024. 大規模言語モデルを活用したノーコードツールによるAI人材育成での学習体験の向上. 第16回データ工学と情報マネジメントに関するフォーラム (DEIM 2024). [PDF]
- 杉本海人, 壹岐太一, 知田悠生, 金沢輝一, 相澤彰子. 2023. JMedRoBERTa: 日本語の医学論文にもとづいた事前学習済み言語モデルの構築と評価. 言語処理学会第29回年次大会 (NLP 2023). [PDF]
- 杉本海人, 相澤彰子. 2021. BERT-based Bi-Ranker による文脈を考慮した引用論文推薦. 言語処理学会第27回年次大会 (NLP 2021). [PDF]
Preprint
- Xanh Ho*, Anh Khoa Duong Nguyen*, An Tuan Dao*, Junfeng Jiang*, Yuki Chida*, Kaito Sugimoto*, Huy Quoc To, Florian Boudin, Akiko Aizawa. 2024. A Survey of Pre-trained Language Models for Processing Scientific Text. [PDF]
講義
- 2024年度 データサイエンス実践基礎 @岩手大学
登壇・執筆
- 内製開発 SaaS のマーケティング分析に LLM を活用する話 - NTT Tech Conference 2025 Lightning Talks (2025.03)
- ノーコードAIツール開発の現場から:プロダクトオーナーの役割 - NTT Communications Engineers' Blog (2024.12) [リンク]
- GitHub Models を使って 20 種類以上の LLM の日本語性能を測定してみた - NTT Communications Engineers' Blog (2024.09) [リンク]
- オープンな日本語埋め込みモデルの選択肢 / Exploring Publicly Available Japanese Embedding Models - Speaker Deck (NTT Communications) (2024.01) [リンク]
- LLMを用いたLLMの自動評価について 〜可能性と注意点〜 - NTT Communications Engineers' Blog (2023.09) [リンク]
その他の活動
- LLM-jp(LLM勉強会)において『日本語LLMまとめ』というリポジトリを公開し、日本語を中心に学習された大規模言語モデル(LLM)に関する情報を継続的に収集しています。[リンク]
- 『Ollamaで体験する国産LLM入門』という技術同人誌を書きました。[リンク1] [リンク2]
連絡先
- kaito.sugimoto [at] ntt.com(仕事用)
- kaito.sugimoto.821 [at] gmail.com(プライベート用)