数据批量处理

批量数据处理是实际业务中常见且重要的操作，它涉及到对大量数据进行高效操作，如数据迁移、批量导入、归档操作或大规模更新等。

为了提升批量处理性能，TiDB 随着版本的演进提供了多种数据批量处理功能：

数据导入
- IMPORT INTO 语句（从 TiDB v7.2.0 开始引入，在 v7.5.0 成为正式功能）
数据增删改
- Pipelined DML（从 TiDB v8.0.0 开始引入，实验特性）
- 非事务性 DML（从 TiDB v6.1.0 开始引入）
- 已废弃的 batch-dml 功能

本文分别介绍这些功能的主要优势、限制和使用场景，帮助你根据实际需求选择合适的方案，从而更高效地完成批量数据处理任务。

数据导入

IMPORT INTO 语句专为数据导入设计，使你无需单独部署 TiDB Lightning，即可将 CSV、SQL 或 PARQUET 等格式的数据快速导入到 TiDB 的一张空表中。

主要优势：

主要限制：

适用场景：

更多信息，请参考 IMPORT INTO。

Pipelined DML 是从 TiDB v8.0.0 开始引入的实验特性。在 v8.5.0 中，TiDB 对该功能进行了完善，其性能得到大幅提升。

主要优势：

主要限制：

适用场景：

更多信息，请参考 Pipelined DML。

非事务 DML 语句是从 TiDB v6.1.0 开始引入的功能。在 v6.1.0 中，该功能仅支持 DELETE 语句。从 v6.5.0 起，该功能新增支持 INSERT、REPLACE、UPDATE 语句。

主要优势：

主要限制：

适用场景：

更多信息，请参考非事务 DML 语句。

TiDB 在 v4.0 之前提供了 batch-dml 功能，用于批量数据处理。该功能已被废弃，不再推荐使用。batch-dml 功能由以下这些系统变量控制：

因为该功能可能引起数据索引不一致，导致数据损坏或丢失，以上变量已被废弃，并计划将在未来的版本中逐渐移除。

不建议在任何场景下使用已被废弃的 batch-dml 功能。建议选择上面描述的其它方案。