水木
水木
发布于 2024-08-22 / 9 阅读
0

Transformers自然语言处理(Natural Language Processing w [Natural Language Processing with Transformers]

链接: https://pan.baidu.com/s/11uidZzZU8yVWlnGXbdyHkA?pwd=c946 提取码: c946

出版社: 东南大学出版社
ISBN:9787576605891
版次:1
商品编码:13935548
品牌:南京东南大学出版社
包装:平装
外文名称:Natural Language Processing with Transformers
开本:16开
出版时间:2023-03-01
用纸:胶版纸
页数:383
字数:499000
正文语种:英文
内容简介
自2017年推出以来,transformers已迅速成为在各种自然语言处理任务中实现最佳结果的主导架构。如果你是一名数据科学家或程序员,这本实践用书将向你展示如何使用Hugging Face Transformers(基于Python的深度学习库)训练和扩展这些大型模型。
Transformers已经被用来撰写真实的新闻故事、改进Google搜索查询,甚至创建会讲老套笑话的聊天机器人。在这本指南中,作者Lewis Tunstall、Leandro von Werra、Thomas Wolf(Hugging Face Transformers的创建者)通过实践方法来教你如何使用transformers以及如何将它集成到你的应用中。你将快速学习可以由transformers帮助解决的各种任务。
为核心NLP任务构建、调试和优化transformers模型,例如文本分类、命名实体识别和问答;
学习如何使用transformers进行跨语言迁移学习;
在缺乏标记数据的实际场景中应用transformers;
使用提取、修剪和量化等技术高效部署transformers模型;
从头开始训练transformers并学习如何扩展到多个GPU和分布式环境。
作者简介
刘易斯·汤斯顿,Lewis Tunstall是Hugging Face的机器学习工程师。他目前的工作重点是为NLP社区开发工具并教人们如何有效地使用这些工具。
目录
Foreword
Preface
1. Hello Transformers
The Encoder-Decoder Framework
Attention Mechanisms
Transfer Learning in NLP
Hugging Face Transformers: Bridging the Gap
A Tour of Transformer Applications
Text Classification
Named Entity Recognition
Question Answering
Summarization
Translation
Text Generation
The Hugging Face Ecosystem
The Hugging Face Hub
Hugging Face Tokenizers
Hugging Face Datasets
Hugging Face Accelerate
Main Challenges with Transformers
Conclusion
2. Text Classification
The Dataset
A First Look at Hugging Face Datasets
From Datasets to DataFrames
Looking at the Class Distribution
How Long Are Our Tweets?
From Text to Tokens
Character Tokenization
Word Tokenization
Subword Tokenization
Tokenizing the Whole Dataset
Training a Text Classifier
Transformers as Feature Extractors
Fine-Tuning Transformers
Conclusion
3. Transformer Anatomy
The Transformer Architecture
The Encoder
Self-Attention
The Feed-Forward Layer
Adding Layer Normalization
Positional Embeddings
Adding a Classification Head
The Decoder
Meet the Transformers
The Transformer Tree of Life
The Encoder Branch
The Decoder Branch
The Encoder-Decoder Branch
Conclusion
4. Multilingual Named Entity Recognition
The Datase