内容来自:机器之心
Tokenization,一直是实现真正端到端语言模型的最后一个障碍。
我们终于摆脱 tokenization 了吗?
答案是:可能性无限大。
最近,Mamba 作者之一 Albert Gu 又发新研究,他参与的一篇论文《 Dynamic Chunking for End-to-End Hierarchical Sequence Modeling 》提出了一个分层网络 H-Net,其用模型内部的动态分块过程取代 tokenization,从而自动发现和操作有意义的数据单元。