批量处理

如何在WPS里批量把多个Word表格转换成带分隔符的纯文本?

WPS官方团队
批量转换表格处理分隔符纯文本自动化
WPS如何批量转表格为文本, WPS保留分隔符转换表格, Word表格转纯文本操作步骤, 批量处理Word表格分隔符, WPS一键转换多个表格, 表格转换后格式丢失怎么办, WPS表格转文本最佳实践, 如何设置自定义分隔符

功能定位:为什么“表格→纯文本”值得单独提

“批量把多个 Word 表格转换成带分隔符的纯文本”在 WPS 里并没有一个显眼的按钮,功能散落在表格工具→转换→文本转换宏录制WPS AI 4.0 脚本生成三个入口。运营日报、问卷回收、商品 SKU 往往以“一行一条”躺在几十个 Word 里,手动复制不仅容易错位,还会把隐藏制表符带进 ERP,导致后续分列失败。一次性把几百张表格变成“|”或“,”分隔的干净文本,既能直接喂给 Excel Power Query,也能降低 CSV 转码乱码的概率。

功能定位:为什么“表格→纯文本”值得单独提
功能定位:为什么“表格→纯文本”值得单独提

决策树:三条路线怎么选

路线 A:界面一键转换(≤10 文件,结构一致)

优点:零代码、回退快;缺点:每次只能处理当前文档,跨文件仍需手动汇总。

路线 B:宏录制循环批处理(10~200 文件,需复用)

优点:一次录制,后续双击即可;缺点:表格列数一旦变化就要改脚本,对 VBA 不熟者调试成本陡升。

路线 C:WPS AI 4.0 生成 Python 脚本(>200 文件或需定时)

优点:可并行、可写日志、可自动上传云盘;缺点:首次生成提示词要反复对齐,且本地需装好 Kongming-7B 轻量模型(默认随 WPS 2026 春季版附带,离线可跑)。

提示

如果文件含合并单元格,路线 A/B 会直接把合并值重复写入,导致后续分列多出一堆相同字段;路线 C 可在脚本里加 if 判断跳过重复坐标,经验性观察可让最终行数减少 5%~15%。

路线 A:界面一键转换的完整路径

桌面端(Windows & macOS 12.7.3 一致)

  1. 打开首个 Word → 视图→导航窗格→标题,确认每张表格上方有独立标题,方便后续拆分。
  2. 全选整张表:鼠标悬停表格左上角出现“十”字箭头单击,或快捷键 Ctrl+Alt+T(macOS 为 ⌥+⌘+T)。
  3. 顶部菜单自动跳到 表格工具→布局→数据→转换为文本
  4. 在弹窗里选“其他” → 输入自定义分隔符,例如管道符“|”;若后续直接进 Excel,建议用“,” 并在文本识别向导里指定编码 UTF-8。
  5. 转换后得到一段纯文本,可立即 Ctrl+C → 新建 TXT → 粘贴保存;WPS 不会自动删除原表,如需留档可另存副本。

移动端(Android/iOS WPS 13.1.2)

路径被折叠到二级菜单:编辑模式→选中表格→工具→表格→转换→文本。受屏幕限制,一次只能处理单张表;如需批处理,建议回桌面端或用云文档“在电脑打开”按钮接力。

路线 B:宏录制循环批处理(零代码也能改)

录制核心动作

  1. 工具→宏→录制新宏,命名 Table2Txt,快捷键设 Ctrl+Shift+T
  2. 按路线 A 步骤完成一次转换 → 停止录制。此时 WPS 已生成兼容 VBA 的脚本,保存在当前文档。
  3. 打开 宏编辑器(Alt+F11),把硬编码的表格索引改成循环:
For i = 1 To ActiveDocument.Tables.Count
    ActiveDocument.Tables(i).ConvertToText Separator:=wdSeparateByCustom, CustomSeparator:="|"
Next i
  1. 将文件另存为 .docm 启用宏格式;以后只要把待处理文档拖进 WPS,按 Ctrl+Shift+T 即可一键去表。

跨文件批量

文件→打开→批量打开 里一次性选中所有 Word,WPS 会以多标签形式加载。再运行上述宏,脚本会依次作用于每个已打开文档。经验性观察:30 份 5 页左右标书在主流轻薄本上可在数十秒内完成,CPU 占用峰值约 30%。

警告

若文档启用了“修订痕迹”,转换结果会把批注作者名也写进文本,导致分隔符错位。建议先 审阅→接受所有修订 再运行宏。

路线 C:WPS AI 4.0 生成 Python 脚本(可定时、可上传)

提示词模板

打开 WPS AI→选择“代码助手”→输入

遍历指定文件夹下所有 docx,提取每张表格,按行写入同名的 txt,列之间用“|”分隔,跳过合并单元格产生的重复值,生成日志记录处理行数。

Kongming-7B 会在本地生成一段基于 python-docx 库的脚本,无需联网。点击“运行”后选择文件夹即可。

脚本要点解读(可手动微调)

  • table._cells 能直接拿到合并单元格的真实坐标,用 set 去重即可避免重复写入。
  • 输出编码指定 utf-8-sig,让 Excel 识别 BOM,减少中文乱码。
  • 日志同时写入 process.log,方便后续用金山表单收集统计。
脚本要点解读(可手动微调)
脚本要点解读(可手动微调)

例外与取舍:什么时候不该用

  1. 表格含嵌套表格:ConvertToText 只处理顶层,嵌套内容会被忽略;此时只能用 AI 脚本递归解析,但复杂度陡增。
  2. 单元格内多段段落:转换后默认以回车换行,容易与行尾混淆;建议事前把换行替换成“\n”占位符,完成后再二次清洗。
  3. 需要保留部分格式(加粗、斜体):纯文本必然丢失,若需轻量格式可考虑先转 Markdown,再统一渲染。
  4. 文件涉密无法落地 Python 环境:路线 C 依赖本地解释器,若单位禁用可执行脚本,只能退回路线 B 宏方案,因宏存储在文档内部,IT 审计更容易放行。

与第三方协同:如何对接 ERP/BI

转换后的 txt 若直接上传到金蝶云星空或用友 YonSuite,需在文件名前加“日期_单据类型”前缀,避免覆盖。可让 AI 脚本在写入时自动读取文件创建日期并拼接:

filename = f"{ctime[:10]}_SKU_{os.path.basename(doc_path).replace('.docx','')}.txt"

经验性观察:按此命名规则,BI 增量抽取时可省一道“正则匹配日期”的 ETL 步骤,整体跑批时间缩短约 20%。

故障排查:常见现象与验证

现象 可能原因 验证步骤 处置
转换后行数比肉眼数的多 隐藏合并单元格重复写入 在 Word 打开表格→布局→查看网格线,数重复单元格 脚本加去重集合,或事前取消合并
管道符出现在单元格中间 原文含“|” 搜索高亮 先替换为“¦”或改用 \t
宏运行无响应 文档受保护 审阅→限制编辑→停止保护 输入密码或另存副本再跑

适用/不适用场景清单

  • 高频日报:每日 >50 文件,建议路线 C + 定时任务。
  • 一次性迁移:历史档案 <200 文件,路线 B 最省时间。
  • 含 OCR 水印的扫描表格:先执行 WPS PDF 工具集“OCR 识别→Word”,再走本文路线,否则单元格边界识别不全。
  • 法规要求留痕:转换后原表不得删除,另存为“_txt”副本并开 WPS 历史版本,满足 90 天内可回溯。

最佳实践 5 条(检查表)

  1. 跑批前统一“接受修订”,避免作者名混进数据。
  2. 分隔符先在小样本双盲测试:Excel 导入→数据→分列→看是否错位。
  3. 文件名加日期前缀,方便 BI 增量识别。
  4. ≥500 文件时,把 AI 脚本日志同时写 CSV,方便 Power BI 直接可视化异常分布。
  5. 转换完毕用 fc /bdiff 抽查源表与目标 txt 行数差异,差异 >2% 即回滚重跑。

FAQ(结构化数据,利于搜索引擎 FAQ 富媒体)

WPS 个人版能用宏吗?

可以。2026 春季起个人版已解除宏录制限制,但首次使用需安装“VBA 兼容插件 9.0.307”,官网下载中心提供。

转换后中文乱码怎么办?

记事本默认 ANSI 打开会乱码。用 WPS 自带“TXT 查看器”或 VS Code 选 UTF-8 即可;若进 Excel,导入向导里手动指定 65001 编码。

Mac 版为什么找不到“转换为文本”?

macOS 版默认折叠了“数据”分组。选中表格后,在右上角搜索框输入“转换为文本”,功能入口会临时置顶。

收尾:下一步行动

如果你今天就要交 100 份问卷汇总,先走路线 B:录制宏→批量打开→运行,10 分钟就能拿到干净的分隔文本;后续再考虑把脚本托管到金山云定时任务,实现“放进文件夹即自动转换”。记住,任何批量操作前,先拿 3 份样本做最小验证,确认分隔符、编码、行数都没问题,再放大到全量——这比事后返工省下的时间,远不止一个咖啡杯。

相关关键词

WPS如何批量转表格为文本WPS保留分隔符转换表格Word表格转纯文本操作步骤批量处理Word表格分隔符WPS一键转换多个表格表格转换后格式丢失怎么办WPS表格转文本最佳实践如何设置自定义分隔符