模块 3

数据清洗工具

手机号/邮箱/地址标准化 · 数据验证 · 异常值检测

📖 场景:你是运营专员,需要标准化 1000 条客户信息

背景:市场部收集了 1000 条客户信息,包含姓名、手机号、邮箱、地址。 数据格式混乱:手机号有各种格式、邮箱大小写不一、地址写法随意。

挑战:手动逐条修改需要一整天,还容易遗漏,影响后续营销活动。

目标:用 AI 生成一个工具,自动识别并标准化所有格式,10 分钟内完成清洗。

🤖 第 1 步:用 AI 生成工具

复制下面的提示词,发送给 AI(ChatGPT/Claude/通义千问等),AI 会生成一个完整的 HTML 工具:

你是一个前端开发专家,擅长用纯 HTML+JS 处理 Excel 文件。

请帮我写一个 Excel 数据清洗工具,需求如下:

【输入】
- 1 个 Excel 文件,包含客户信息
- 列名:姓名、手机号、邮箱、地址

【处理逻辑】
1. 手机号标准化:
   - 去除空格、横杠、括号
   - 统一格式:13812345678
   - 验证是否为 11 位中国大陆手机号

2. 邮箱标准化:
   - 转小写
   - 去除首尾空格
   - 验证邮箱格式是否正确

3. 地址标准化:
   - 提取省/市/区(如果包含)
   - 统一格式:XX 省 XX 市 XX 区 XXX

4. 添加验证列:
   - 手机有效(是/否)
   - 邮箱有效(是/否)
   - 完整度评分(0-100)

【输出】
- 1 个 Excel 文件
- Sheet1(清洗后数据):标准化后的数据
- Sheet2(无效数据):验证失败的数据
- Sheet3(统计报告):有效数量、无效数量、完整度分布

【要求】
- 纯 HTML 文件,双击浏览器打开就能用
- 数据在本地处理,不上传服务器
- 使用 SheetJS 库
- 代码要有详细注释

请生成完整的 HTML 代码。

💡 提示:把 AI 生成的代码保存为 .html 文件,双击浏览器打开即可使用。

📁 第 2 步:上传 Excel 文件

📤
点击选择文件或拖拽到此处
支持格式:.xlsx, .xls, .csv
0 行数据 0 列 0 KB

⚙️ 第 3 步:选择清洗选项

处理中... 0%

正在读取文件...

✅ 清洗完成!

0
原始数据
0
有效数据
0
无效数据
0
重复数据

🤖 1. 如何用 AI 生成这个工具?

你是一个前端开发专家,擅长用纯 HTML+JS 处理 Excel 文件。 请帮我写一个 Excel 数据清洗工具,需求如下: 【输入】 - 1 个 Excel 文件,包含客户信息 - 列名:姓名、手机号、邮箱、地址 【处理逻辑】 1. 手机号标准化:去除空格/横杠/括号,统一 11 位格式,验证有效性 2. 邮箱标准化:转小写、去空格、验证格式 3. 地址标准化:提取省/市/区,统一格式 4. 添加验证列:手机有效(是/否)、邮箱有效(是/否)、完整度评分 5. 去除重复数据 6. 生成 3 个 Sheet:清洗后数据、无效数据、统计报告 【要求】 - 纯 HTML 文件,双击浏览器打开就能用 - 数据在本地处理,不上传服务器 - 使用 SheetJS 库 - 界面美观,有进度提示 - 代码要有详细注释 请生成完整的 HTML 代码。

🤖 2. 如何用 AI 修改这个工具?

如果你想调整工具的功能,用大白话描述需求,让 AI 帮你改:

我有一个 Excel 数据清洗工具,现在想调整功能。 当前功能: - 上传 Excel 文件 - 手机号标准化(统一成 13812345678 格式) - 邮箱清洗(格式验证) - 地址清理(去除空格、特殊字符) - 可以标记异常数据 我想改成: 1. 加一个"公司名称"列的标准化(统一大写,去除 Ltd/Co 等后缀) 2. 根据公司名称关键词,自动识别"行业分类"(比如科技公司、贸易公司) 3. 生成一个"地区分布"统计表 请帮我修改工具代码,保持其他功能不变。
💡 小提示:
不需要懂代码,用大白话描述需求就行。AI 会理解并修改代码。