在自然语言处理（NLP）领域，填空或填补句子中的缺失部分是一项重要的任务。它不仅考验了模型对语言的理解能力，还展示了其生成合理且语义连贯的文本的能力。Hugging Face 的 Transformers 框架通过其 Pipeline API 提供了强大的fill-mask功能，允许开发者和研究者轻松构建并应用这种填空技术。本文将详细介绍 Transformers 框架中的fill-mask任务，涵盖任务描述、应用场景、配置指南以及实战案例。

Hugging Face任务介绍

1. 任务简介

fill-mask任务旨在根据上下文预测句子中被遮蔽（mask）的词汇。例如：

文学创作：当给出“[MASK] is the capital of France.”时，系统应当能够预测出“Paris”。
语言学习：对于学习新语言的学生来说，可以用来练习语法结构和词汇选择，如“Je [MASK] à l’école tous les jours.”（我每天都去学校）。

为了完成这一任务，通常需要以下步骤：

输入解析：识别句子中被标记为[MASK]的位置。
上下文理解：分析句子的上下文，包括前后词语的关系、句法结构等。
词汇预测：基于对上下文的理解，从词汇表中选出最合适的词来填补空白。

根据 Hugging Face 官网的数据，当前已有13,576 个预训练模型支持fill-mask任务，这些模型已经在大量的文本数据上进行了微调，以更好地适应特定的任务需求。

Hugging Face模型列表

2. 应用场景

填充蒙版任务的应用非常广泛，以下是几个典型的应用实例：

机器翻译：帮助改进翻译质量，确保译文更加流畅自然。
文本补全：用于自动完成功能，提高用户输入效率，如在搜索引擎或聊天机器人中。
教育工具：作为语言学习辅助工具，增强学生对单词和短语的记忆。
内容推荐：根据用户的阅读历史，预测他们可能感兴趣的主题词，从而提供个性化的内容推荐。
智能写作助手：协助作家克服创作瓶颈，提供灵感启发，比如续写故事或完善段落。

3. 任务配置

在 Transformers 框架中，fill-mask任务的配置同样直观易懂。下面是配置示例代码片段（位于./transformers/pipelines/__init__.py文件）：

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
14
15
16
17
18
SUPPORTED_TASKS = {
    # 其他省略......

    "fill-mask": {
        "impl": FillMaskPipeline,
        "tf": (TFAutoModelForMaskedLM,) if is_tf_available() else (),
        "pt": (AutoModelForMaskedLM,) if is_torch_available() else (),
        "default": {
            "model": {
                "pt": ("distilbert/distilroberta-base", "fb53ab8"),
                "tf": ("distilbert/distilroberta-base", "fb53ab8"),
            }
        },
        "type": "text",
    },

    # 其他省略......
}

默认情况下，Transformers 框架会使用distilroberta-base作为fill-mask任务的预训练模型。这个模型是基于 BERT 架构，在大规模英语语料库上训练而成，特别适合英文的填空任务。

4. 填充蒙版实战

确保您已经安装了 Transformers 库和其他必要的依赖包：

1
pip install transformers torch

方法一：自动下载模型

如果您的网络环境允许，可以直接从 Hugging Face 下载模型并创建 Pipeline 任务。如下老牛同学使用 Hugging Face 镜像网站自动下载模型：

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
14
15
16
17
18
19
import os

# 设置代理
os.environ["HF_ENDPOINT"] = "https://hf-mirror.com"

# 设置本地缓存目录
cache_dir = os.path.join('D:', os.path.sep, 'ModelSpace', 'Cache')
os.environ['HF_HOME'] = cache_dir

from transformers import pipeline

# 创建Pipeline任务
nlp = pipeline("fill-mask", model="google-bert/bert-base-chinese")

# 执行填充蒙版任务
if __name__ == "__main__":
    result = nlp("生活的真谛是[MASK]。")

    print(result)

输出结果直接给出了模型认为的最佳答案文本，在这个例子中：输入是生活的真谛是[MASK]。，给出了多个输出：

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
[
  {
    'score': 0.34068214893341064,
    'token': 5401,
    'token_str': '美',
    'sequence': '生 活 的 真 谛 是 美 。'
  },
  {
    'score': 0.22919395565986633,
    'token': 4263,
    'token_str': '爱',
    'sequence': '生 活 的 真 谛 是 爱 。'
  },
  {
    'score': 0.03254768252372742,
    'token': 727,
    'token_str': '乐',
    'sequence': '生 活 的 真 谛 是 乐 。'
  },
  {
    'score': 0.022956570610404015,
    'token': 782,
    'token_str': '人',
    'sequence': '生 活 的 真 谛 是 人 。'
  },
  {
    'score': 0.01942041702568531,
    'token': 8038,
    'token_str': '：',
    'sequence': '生 活 的 真 谛 是 ： 。'
  }
]

对于输出结果对象的元素，详细说明如下：

sequence：完整填充后的句子。
score：模型对该填充选项的信心程度，值越大表示越有信心。
token：填充词汇对应的 token ID，在词汇表中的位置。
token_str：填充词汇内容。

方法二：自主下载模型

如果您希望使用本地模型文件，可以按照以下步骤操作：

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
14
from transformers import AutoTokenizer, AutoModelForMaskedLM, pipeline
import os

# 下载模型目录
model_dir = '/models/fill_mask'

# 加载分词器和模型
tokenizer = AutoTokenizer.from_pretrained(model_dir, local_files_only=True)
model = AutoModelForMaskedLM.from_pretrained(model_dir, torch_dtype="auto", device_map="auto", local_files_only=True)

# 创建Pipeline任务
nlp = pipeline("fill-mask", tokenizer=tokenizer, model=model)

# 后续用法与自动下载相同

5. WebUI 界面

为了让fill-mask Pipeline 任务更易于使用或演示，我们可以使用 Gradio 创建一个直观的 WebUI 界面。以下是创建界面的代码示例：

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
import sys

# 直接复用Pipeline实例
sys.path.append("./")
pipeline = __import__("06-fill-mask")

import gradio as gr


# 定义填充蒙版函数
def fill_mask(sentence):
    result = pipeline.nlp(sentence)
    return "\n".join([f"可能的答案: {r['sequence']} (得分: {r['score']:.2f})" for r in result])

# 创建Gradio界面
with gr.Blocks() as demo:
    gr.Markdown("# 填充蒙版系统")
    gr.Markdown(
        "这是一个基于Transformers框架的填充蒙版工具。您可以输入一句含有[MASK]标记的句子，点击“提交”按钮后，系统将尝试预测最适合填入该位置的词汇。")

    with gr.Row():
        input_sentence = gr.Textbox(placeholder="请输入含有[MASK]标记的句子...", label="句子")

    with gr.Row():
        submit_button = gr.Button("提交")

    with gr.Row():
        output_answer = gr.Label(label="可能的答案")

    # 设置按钮点击事件，触发填充蒙版函数
    submit_button.click(fill_mask, inputs=[input_sentence], outputs=output_answer)

# 启动Gradio应用
if __name__ == "__main__":
    demo.launch()

运行上述代码，我们可以看到 URL 信息：

1
2
3
* Running on local URL:  http://127.0.0.1:7860

To create a public link, set `share=True` in `launch()`.

通过浏览器打开地址，就可以通过可视化的方式进行填充蒙版实验了。

WebUI界面

我们可以用如下句子样例来测试 Fill Mask：

输入：“生活的真谛是[MASK]。”
答案有：“美”、“爱”、“乐”、“人”等

如果想要分享给更多人，可以在 launch() 函数中设置 share=True 参数，Gradio 将生成一个公开链接供他人访问。

6. 总结

本文全面介绍了 Transformers 框架中的fill-mask任务，从基础概念到实际应用，再到如何构建和部署一个交互式的填充蒙版系统。无论是在机器翻译、文本补全还是教育工具等领域，Transformers 框架都能为我们提供强有力的支持，助力我们快速实现高效的填充蒙版解决方案。

老牛同学将持续为大家带来更多有关 Pipeline 任务的文章（共28篇）。如果您有任何疑问或建议，请随时在评论区留言交流！

Transformers 框架 Pipeline 任务

Transformers 框架：

01.包和对象加载中的设计巧思与实用技巧

02.AutoModel 初始化及 Qwen2.5 模型加载全流程

03.Qwen2.5 大模型的 AutoTokenizer 技术细节

04.Qwen2.5/GPT 分词流程与 BPE 分词算法技术细节

05.嵌入（Embedding）机制和 Word2Vec 实战

Pipeline NLP 任务：

零·概述丨 01.文本转音频丨 02.文本分类丨 03.词元分类和命名实体识别丨 04.问答丨 05.表格问答

基于 Qwen2.5-Coder 模型和 CrewAI 多智能体框架，实现智能编程系统的实战教程

vLLM CPU 和 GPU 模式署和推理 Qwen2 等大语言模型详细教程

基于 Qwen2/Lllama3 等大模型，部署团队私有化 RAG 知识库系统的详细教程（Docker+AnythingLLM）

使用 Llama3/Qwen2 等开源大模型，部署团队私有化 Code Copilot 和使用教程

基于 Qwen2 大模型微调技术详细教程（LoRA 参数高效微调和 SwanLab 可视化监控）

ChatTTS 长音频合成和本地部署 2 种方式，让你的“儿童绘本”发声的实战教程

微信公众号：老牛同学