极速阅览

Yuchen Han

An explorer of AI and NLP

长上下文语言建模综述

Posted on July 14, 2025

Jiaheng Liu∗,†, Dawei Zhu∗,†, Zhiqi Bai★, Yancheng He★, Huanxuan Liao★, Haoran Que★, Zekun Wang★, Chenchen Zhang★, Ge Zhang★, Jiebin Zhang★, Yuanxing Zhang★, Zhuo Chen, Hangyu Guo, Shilong Li, Ziqiang Liu, Yong Shan, Yifan Song, Jiayi Tian, Wenhao Wu, Zhejian Zhou, Ruijie Zhu, Junlan Feng, Yang Gao, Shizhu He, Zhoujun Li,... [Read More]

Tags: 自然语言处理

神经机器翻译中的模型集成：经验之谈

Posted on August 27, 2021

背景集成学习是一种联合多个学习器进行协同决策的机器学习方法，通过整合多个学习器的决策结果可以有效减小预测结果的方差与偏置，显著提升模型的泛化能力，达到比单学习器更好的效果。对于神经机器翻译中的集成学习，实验室李北师兄的论文《On Ensemble Learning of Neural Machine Translation》针对NMT中的模型集成进行了大量的实验对比。本人也在不同规模的数据集上进行了尝试，将经验总结如下。 [Read More]

Tags: 机器翻译

Notes of TorchText - a nlp tool

Posted on April 11, 2021

前言毕业设计中偷懒用了一些轮子，TorchText就是其中一个:)主要用了它来加载数据、构建词表、得到训练、测试及验证集的生成器等等。本篇博客主要记录一下我用过的，觉得非常有用、有趣的功能，方便回顾。 [Read More]

Tags: 自然语言处理

A comparison of Chinese word segmentation tools

Posted on April 11, 2021

前言中文分词在汉语机器翻译系统中是一个关键部分，我最近深有感触。本博客旨在对中文分词算法进行初步研究，并对现存的中文分词工具进行多方面的对比（注：已发现优秀的轮子，这个部分就不做了） [Read More]

Tags: 自然语言处理

Some Pytorch practices of LSTM

Posted on April 5, 2021

前言本篇博客记录了我对LSTM的理论学习、PyTorch上LSTM和LSTMCell的学习，以及用LSTM对Seq2Seq框架+注意力机制的实现。还包括了很多有趣的细节，包括RNNs对批量序列数据Padding的处理，以及多层RNNs中Dropout的使用等等。 [Read More]

Tags: 深度学习

Older Posts →