Изменённая версия алгоритма создаёт «[[Токен (искусственный интеллект)|токены]]» (единицы распознавания), соответствующие различным объёмам исходного текста, от отдельных символов (включая отдельные цифры или знаки препинания) до целых слов (даже длинных составных слов)<ref>{{cite arXiv|eprint=1508.07909|class=cs.CL|first1=Rico|last1=Sennrich|first2=Alexandra|last2=Birch|title=Neural Machine Translation of Rare Words with Subword Units|date=2015-08-31|last3=Haddow|first3=Barry}}</ref><ref>{{cite arXiv|eprint=2005.14165|last6=Dhariwal|last11=Agarwal|first10=Amanda|last10=Askell|first9=Girish|last9=Sastry|first8=Pranav|last8=Shyam|first7=Arvind|last7=Neelakantan|first6=Prafulla|first5=Jared|class=cs.CL|last5=Kaplan|first4=Melanie|last4=Subbiah|first3=Nick|last3=Ryde r|date=2020-06-04|title=Language Models are Few-Shot Learners|last2=Mann|first2=Benjamin|last1=Brown|first1=Tom B.|first11=Sandhini}}</ref><ref>{{cite web|date=2021-03-02|title=google/sentencepiece|url=https://github.com/google/sentencepiece|access-date=2021-03-02|publisher=Google}}</ref>. | Изменённая версия алгоритма создаёт «[[Токен (искусственный интеллект)|токены]]» (единицы распознавания), соответствующие различным объёмам исходного текста, от отдельных символов (включая отдельные цифры или знаки препинания) до целых слов (даже длинных составных слов)<ref>{{cite arXiv|eprint=1508.07909|class=cs.CL|first1=Rico|last1=Sennrich|first2=Alexandra|last2=Birch|title=Neural Machine Translation of Rare Words with Subword Units|date=2015-08-31|last3=Haddow|first3=Barry}}</ref><ref>{{cite arXiv|eprint=2005.14165|last6=Dhariwal|last11=Agarwal|first10=Amanda|last10=Askell|first9=Girish|last9=Sastry|first8=Pranav|last8=Shyam|first7=Arvind|last7=Neelakantan|first6=Prafulla|first5=Jared|class=cs.CL|last5=Kaplan|first4=Melanie|last4=Subbiah|first3=Nick|last3=Ryde r|date=2020-06-04|title=Language Models are Few-Shot Learners|last2=Mann|first2=Benjamin|last1=Brown|first1=Tom B.|first11=Sandhini}}</ref><ref>{{cite web|date=2021-03-02|title=google/sentencepiece|url=https://github.com/google/sentencepiece|access-date=2021-03-02|publisher=Google}}</ref>. |