手机浏览器扫描二维码访问
巧妇难为无米之炊,数据就是机器学习的“米”。
- 数据收集:比如要做推荐系统,得收集用户的浏览记录、点击行为;要做疾病预测,得收集病人的病历、检查报告。
- 数据预处理:这步特别关键,就像淘米要去沙。包括:
- 处理缺失值:比如某个人的年龄没填,得想办法补上或删掉。
- 处理异常值:比如收入里突然出现一个“1亿”,明显不合理,得处理掉。
- 特征缩放:比如身高是“170cm”,体重是“60kg”,单位和数值范围不一样,得统一缩放(比如都缩到0-1之间),不然模型会“偏心”。
2. 特征工程:给数据“化妆”,让模型看得更清楚
“特征”就是数据里的关键信息。比如判断西瓜好坏,“色泽、根蒂、敲声”就是特征。特征工程是从原始数据里提炼出有用特征的过程,直接影响模型效果。
- 有时候要人工设计特征:比如把“日期”拆成“星期几”“是否节假日”。
- 有时候用算法自动提取特征:比如深度学习里的CNN,能自动从图像里提取“边缘、形状”这些特征,不用人类操心。
3. 模型训练:让机器“刷题涨本事”
选好算法(比如决策树、神经网络),把处理好的数据喂给它,机器就开始“学习”了。它会不断调整内部参数,让预测结果和真实情况越来越接近。
- 训练过程中,得注意过拟合和欠拟合:
- 欠拟合:模型太“笨”,连训练数据都没学好,比如把所有邮件都当成正常邮件。
- 过拟合:模型太“教条”,把训练数据里的噪声也学进去了,比如只认识训练过的那几张人脸,换张角度就不认识了。
解决方法也不少,比如“正则化”(给模型加约束,不让它学太细)、“增加数据量”“模型简化”等。
4. 模型评估:给机器“考试”打分
训练好的模型得测试一下准不准。常用的指标有:
- 准确率(Accuracy):预测对的比例,比如100个邮件,90个判对了,准确率就是90%。但它在“数据不平衡”时不准,比如垃圾邮件只有5%,模型全判正常,准确率也有95%,但没用。
桃花岛的人生情节跌宕起伏、扣人心弦,是一本情节与文笔俱佳的其他类型小说,桃花岛的人生-杨梦芯-小说旗免费提供桃花岛的人生最新清爽干净的文字章节在线阅读和TXT下载。...
1.云之羽——重生上官浅(疯批事业批,男人是过客,流火是真爱)1-1.云之羽——后续故事续写(主一些身份猜测和两对cp的归属)2.花千骨——霓漫天重生3.长月无烬——叶冰裳重生4.人间烟火——叶子(之——去他的替身梗)5.武林外传——郭芙蓉X白展堂(叛逆官家小姐X胆小潇洒神偷)6.……欢迎留意见,但是不一定采纳。哈......
珍月楼情节跌宕起伏、扣人心弦,是一本情节与文笔俱佳的其他类型小说,珍月楼-萌春-小说旗免费提供珍月楼最新清爽干净的文字章节在线阅读和TXT下载。...
2021年最好的假面骑士文!东野龙介从黑暗中醒来,发现居然来到空我的世界,而且是超古代时期里克封印古郎基的时候。因为不小心卷入战斗被达古巴攻击成重伤,随后里克将第二条空我腰带赋予了龙介,就这样被一起封印在遗迹之中。数万年后,当他再次伴随着遗迹苏醒,又会对这个世界造成什么影响呢?萌新求包养,旧活新整,老朋友可以先收藏养着,不过内容也会有一定修改,新朋友们希望大家能多支持一下假面骑士同人,谢谢您嘞(*°▽°)?...
筑凤台情节跌宕起伏、扣人心弦,是一本情节与文笔俱佳的其他类型小说,筑凤台-郁轮袍-小说旗免费提供筑凤台最新清爽干净的文字章节在线阅读和TXT下载。...
乔翊身为动物园管理员,本来兢兢业业地干活,谁知一朝醒来却成了一只草原雄狮。 穿成狮子也就算了,问题是还是一只在战斗中受伤濒死的雄狮,身上的牙洞穿透了腹部,鲜血一直往外淌,远处的鬣狗正对它十分垂涎,发出难听的叫声。 而旁边还有雄狮正看着它,乔翊很清楚这身上的伤就是拜这只雄狮所赐,而如果它预计没错,这头雄狮并不打算放它活着离开领地。 雄狮的领地意识极强,一旦有其他雄狮闯入领地,这头雄狮就会毫不犹豫地杀死对方。 乔翊有些绝望地闭上眼睛,试图站起来,但似乎不太能成功。 那头凶残地雄狮迈着步子走到它旁边,露出了獠牙,乔翊垂死挣扎地低吼了一声,觉得自己大概是要三分钟结束狮生了,谁知伤口处传来微微痛痒的感觉。 它一睁眼就看到这头狮子在舔着它的毛。 作为动物管理员,乔翊很清楚这是雄狮的什么行为,它的震惊几乎表现在了狮脸上—— 你竟然还敢求偶!欺狮太甚! 阅读指南: 1、主角会一直是狮子,不会变成人,没有任何变人情节,没有任何副CP 2、开端部分会有攻受互相打架(毕竟是狮子,还是会打起来的,但是后面就是甜甜甜) 3、拒绝一切人身攻击(此处作者竖起了反弹护身盾,缘分一线牵,请友好留言,鞠躬)...