丰言的博客

Markdown语法

发表于 2023-02-23 更新于 2025-11-13 分类于博客， Markdown Disqus：本文字数： 1.2k 阅读时长 ≈ 4 分钟

Markdown语法的记录，方便以后使用。

阅读全文 »

BPE算法详解

发表于 2023-02-21 更新于 2025-11-13 分类于算法，学习， Tokenization Disqus：本文字数： 3.3k 阅读时长 ≈ 12 分钟

在NLP模型中，输入通常是一个句子，例如"I went to New York last week"，一句话中包含很多单词(token)。传统的做法是将这些单词以空格进行分隔，例如['i', 'went', 'to', 'New', 'York', 'last', 'week']。然而这种做法存在很多问题，例如模型无法通过old, older, oldest之间的关系学到smart, smarter, smartest之间的关系。如果我们能使用将一个 token 分成多个 subtokens ，上面的问题就能很好的解决。本文将详述目前比较常用的subtokens算法——BPE（Byte-Pair Encoding）。

阅读全文 »

Hexo-NexT版本更新记录

发表于 2023-02-14 更新于 2025-11-13 分类于博客， Hexo Disqus：本文字数： 593 阅读时长 ≈ 2 分钟

Hexo-NexT主题可以通过git pull进行平滑更新，但在之前的版本中，如果对NexT主题做了自定义修改，就会使得主题更新变得比较麻烦。目前版本可以通过数据文件将配置与主题分离，同时也可以把自定义布局、样式放到数据文件中，不用再修改主题源码，便于后续更新。

阅读全文 »

【文献阅读】GPT: Improving Language Understanding by Generative Pre-Training

发表于 2023-02-13 更新于 2025-11-13 分类于算法，文献阅读 Disqus：本文字数： 2k 阅读时长 ≈ 7 分钟

机构：OpenAI
论文地址：

论文代码：

阅读全文 »

ChatGPT起源

发表于 2023-02-13 更新于 2025-11-13 分类于算法，学习， AIGC Disqus：本文字数： 2.9k 阅读时长 ≈ 10 分钟

最近ChatGPT大火，写一篇介绍ChatGPT起源的文章来梳理一下自己对ChatGPT的理解。

阅读全文 »

Ubuntu&Mac安装配置Oh My Zsh

发表于 2023-02-10 更新于 2025-11-13 分类于工具， Ubuntu Disqus：本文字数： 684 阅读时长 ≈ 2 分钟

Oh My Zsh是一款社区驱动的命令行工具，是基于Zsh命令行的一个扩展工具集，提供了丰富的扩展功能，如：主题配置，插件机制，内置的便捷操作等，可以给我们一种全新的命令行使用体验。下文对Oh My Zsh的安装及配置方法进行总结，只总结最佳的实践。

阅读全文 »

Java线程池的使用

发表于 2023-02-09 更新于 2025-11-13 分类于工程， Java Disqus：本文字数： 2.9k 阅读时长 ≈ 11 分钟

Java语言虽然内置了多线程支持，启动一个新线程非常方便，但是，创建线程需要操作系统资源（线程资源，栈空间等），频繁创建和销毁大量线程需要消耗大量时间。

阅读全文 »

Hexo-Next主题基本配置和优化

发表于 2023-02-02 更新于 2025-11-13 分类于博客， Hexo Disqus：本文字数： 1k 阅读时长 ≈ 4 分钟

Hexo-Next主题基本配置和优化。环境：NexT version 8.14.2

阅读全文 »

GitHub+Hexo搭建个人博客

发表于 2023-02-02 更新于 2025-11-13 分类于博客， Hexo Disqus：本文字数： 642 阅读时长 ≈ 2 分钟

Hexo是一款基于Node.js的静态博客框架，依赖少易于安装使用，可以方便的生成静态网页托管在GitHub和Heroku上，是搭建博客的首选框架。

阅读全文 »