← Back to deck

模块 3数据清洗工具

手机号/邮箱/地址标准化 · 数据验证 · 异常值检测

📖 场景:你是运营专员,需要标准化 1000 条客户信息

背景:市场部收集了 1000 条客户信息,包含姓名、手机号、邮箱、地址。 数据格式混乱:手机号有各种格式、邮箱大小写不一、地址写法随意。

挑战:手动逐条修改需要一整天,还容易遗漏,影响后续营销活动。

目标:上传客户信息表,自动标准化手机号、邮箱和地址,并输出清洗结果与问题数据。

📥 案例数据

下载包含手机号、邮箱、地址问题的客户信息表,用它演示标准化和数据验证。

下载案例数据:客户信息_原始数据_示例.xlsx

📁 第 1 步:上传 Excel 文件

📤
点击选择文件或拖拽到此处
支持格式:.xlsx, .xls, .csv
0 行数据 0 列 0 KB

⚙️ 第 2 步:选择清洗选项

处理中 // PROCESSING... 0%

正在读取文件...

✅ 清洗完成 // CLEANING SUCCESSFUL

0
原始数据
0
有效数据
0
无效数据
0
重复数据

附录 // 如何让 AI 生成类似工具?

你是一个前端开发专家,擅长用纯 HTML+JS 处理 Excel 文件。

请帮我写一个 Excel 数据清洗工具,需求如下:

【输入】
- 1 个 Excel 文件,包含客户信息
- 列名:姓名、手机号、邮箱、地址

【处理逻辑】
1. 手机号标准化:去除空格/横杠/括号,统一 11 位格式,验证有效性
2. 邮箱标准化:转小写、去空格、验证格式
3. 地址标准化:提取省/市/区,统一格式
4. 添加验证列:手机有效(是/否)、邮箱有效(是/否)、完整度评分
5. 去除重复数据
6. 生成 3 个 Sheet:清洗后数据、无效数据、统计报告

【要求】
- 纯 HTML 文件,双击浏览器打开就能用
- 数据在本地处理,不上传服务器
- 使用 SheetJS 库
- 界面美观,有进度提示
- 代码要有详细注释

请生成完整的 HTML 代码。

查看这个提示词的静态输出样稿

附录 // 如何用 AI 修改这个工具?

如果你想调整工具的功能,用大白话描述需求,让 AI 帮你改:

我有一个 Excel 数据清洗工具,现在想调整功能。

当前功能:
- 上传 Excel 文件
- 手机号标准化(统一成 13812345678 格式)
- 邮箱清洗(格式验证)
- 地址清理(去除空格、特殊字符)
- 可以标记异常数据

我想改成:
1. 加一个"公司名称"列的标准化(统一大写,去除 Ltd/Co 等后缀)
2. 根据公司名称关键词,自动识别"行业分类"(比如科技公司、贸易公司)
3. 生成一个"地区分布"统计表

请帮我修改工具代码,保持其他功能不变。
💡 小提示 // PRO TIP
不需要懂代码,用大白话描述需求就行。AI 会理解并修改代码。