分类机器学习下的文章 - 奥林匹克技术竞赛~ - 做一名不被定义的苏南大叔

苏南大叔 » 机器学习

分类机器学习下的文章【分类结果介于标签结果和搜索结果之间】

机器学习，如何使用fetch_openml加载泰坦尼克数据集？

发布于2024年05月17日

在sklearn包里面，并不存在titanic.csv数据集文件本身。但是，可以通过fetch_openml()函数扩展到很多数据集，其中就包括titanic数据集。并且，在openml网站上，这个泰坦尼克数据集还...

机器学习数据集，解读泰坦尼克数据，有哪些字段？

发布于2024年05月16日

继鸢尾花数据集之后，苏南大叔来分析一下机器学习中非常著名的泰坦尼克数据集。这个数据集的标签是“survived”，而字段包括：年龄、阶层、票价、仓号、登船地、是否有亲戚同乘等等。数据表明：泰坦尼克号的乘客里面，最终...

机器学习的算法中，关于预测准确率的N种实现方案

发布于2024年05月13日

在对各种数据集进行预测的过程中，最后一步总是要显示算法预测的准确度。注意，是准确度accuracy而不是查准率precision，这两个概念很容易混淆。苏南大叔的“奥林匹克技术竞赛”博客，记录苏南大叔的代码故事。本文测...

CatBoost模型，如何对鸢尾花数据集进行预测？

发布于2024年05月12日

人工智能有很多种算法模型，苏南大叔已经写过很多相关算法文章了。本文要写的是一个catboost算法，来对鸢尾花数据进行处理。看看catboost模型，有什么特殊的地方没有？苏南大叔的“奥林匹克技术竞赛”博客，记录苏南大...

以鸢尾花逻辑回归为例，如何理解预测结果的系数和截距？

发布于2023年12月25日

本文再次审视鸢尾花数据集的逻辑回归模型，审视的角度是：模型训练后得到的系数coef_和截距intercept_。得到这两个数据后，可以说明什么问题呢？苏南大叔的“奥林匹克技术竞赛”博客，记录苏南大叔的代码编程经验文章。...