Skip to content
Projects
Groups
Snippets
Help
This project
Loading...
Sign in / Register
Toggle navigation
人
人工智能系统实战第三期
Overview
Overview
Details
Activity
Cycle Analytics
Repository
Repository
Files
Commits
Branches
Tags
Contributors
Graph
Compare
Charts
Issues
0
Issues
0
List
Board
Labels
Milestones
Merge Requests
0
Merge Requests
0
CI / CD
CI / CD
Pipelines
Jobs
Schedules
Charts
Wiki
Wiki
Snippets
Snippets
Members
Members
Collapse sidebar
Close sidebar
Activity
Graph
Charts
Create a new issue
Jobs
Commits
Issue Boards
Open sidebar
liyinkai
人工智能系统实战第三期
Commits
8fcd6975
Commit
8fcd6975
authored
Oct 21, 2023
by
前钰
Browse files
Options
Browse Files
Download
Email Patches
Plain Diff
Update README.md
parent
013a5785
Hide whitespace changes
Inline
Side-by-side
Showing
1 changed file
with
24 additions
and
1 deletions
+24
-1
README.md
人工智能系统实战第三期/实战代码/机器学习项目实战/贝叶斯垃圾邮件分类/README.md
+24
-1
No files found.
人工智能系统实战第三期/实战代码/机器学习项目实战/贝叶斯垃圾邮件分类/README.md
View file @
8fcd6975
**项目数据集链接:**
[
数据集下载链接
](
https://pan.baidu.com/s/1AgHi10abQqI689pMeRGxbQ?pwd=DTAI
)
# 贝叶斯垃圾邮件分类
# 贝叶斯垃圾邮件分类
**项目数据集链接:**
[
数据集下载链接
](
https://pan.baidu.com/s/1AgHi10abQqI689pMeRGxbQ?pwd=DTAI
)
### 本次作业以垃圾邮件分类任务为基础,要求提取文本特征并使用朴素贝叶斯算法进行垃圾邮件识别(调用已有工具包或自行实现)。
### 任务介绍
电子邮件是互联网的一项重要服务,在大家的学习、工作和生活中会广泛使用。但是大家的邮箱常常被各种各样的垃圾邮件填充了。有统计显示,每天互联网上产生的垃圾邮件有几百亿近千亿的量级。因此,对电子邮件服务提供商来说,垃圾邮件过滤是一项重要功能。而朴素贝叶斯算法在垃圾邮件识别任务上一直表现非常好,至今仍然有很多系统在使用朴素贝叶斯算法作为基本的垃圾邮件识别算法。
本次实验
基本作业(80分):
1.
提取正文部分的文本特征;
2.
划分训练集和测试集
3.
使用朴素贝叶斯算法完成垃圾邮件的分类与预测,要求计算测试集准确率Accuracy、精准率Precision、召回率Recall
4.
对比特征数目(词表大小)对模型效果的影响;
5.
提交代码和实验报告。
扩展作业(20分):
1.
尝试使用邮件头信息协助判断垃圾邮件
2.
尝试自行实现朴素贝叶斯算法细节;
\ No newline at end of file
Write
Preview
Markdown
is supported
0%
Try again
or
attach a new file
Attach a file
Cancel
You are about to add
0
people
to the discussion. Proceed with caution.
Finish editing this message first!
Cancel
Please
register
or
sign in
to comment