24个提高您的知识和技术的机械学习项目--初学者篇

作者:leyu乐鱼体育官网发布时间:2021-12-22 12:20

本文摘要:一、先容数据科学(机械学习)项目为您提供了一种有前途的方式来启动您在该领域的职业。您不仅可以通过应用它来学习数据科学,还可以在自己的简历上展示一些项目!如今,招聘人员通过他/她的事情来评估应聘者的潜力,而不是将重点放在认证上。如果您只告诉他们,如果您什么都没告诉他们,知道几多,就没关系了!那是大多数人挣扎而错过的地方。 您以前可能已经处置惩罚过几个问题,可是如果您无法使其体现得那么好且易于解释,那么究竟有人会知道您的能力呢?这些项目将为您提供资助。

leyu乐鱼体育

一、先容数据科学(机械学习)项目为您提供了一种有前途的方式来启动您在该领域的职业。您不仅可以通过应用它来学习数据科学,还可以在自己的简历上展示一些项目!如今,招聘人员通过他/她的事情来评估应聘者的潜力,而不是将重点放在认证上。如果您只告诉他们,如果您什么都没告诉他们,知道几多,就没关系了!那是大多数人挣扎而错过的地方。

您以前可能已经处置惩罚过几个问题,可是如果您无法使其体现得那么好且易于解释,那么究竟有人会知道您的能力呢?这些项目将为您提供资助。想想您将花在这些项目上的时间,例如培训课程。训练花费的时间越多,您就会变得更好!我们确保为您提供来自差别领域的种种问题。我们认为,每小我私家都必须学习如何巧妙地处置惩罚大量数据,因此其中包罗大型数据集。

另外,我们确保所有数据集都是开放的而且可以自由会见。二、目录初学者级 虹膜数据贷款预测数据Bigmart销售数据波士顿衡宇数据时间序列分析数据葡萄酒质量数据Turkiye学生评估数据身高体重数据2.中级玄色星期五数据人类运动识别数据暹罗角逐数据行程记载数据百万首歌曲数据人口普查收入数据影戏镜头数据Twitter分类数据3.高级识别您的数字都会声音分类Vox名人资料ImageNet数据芝加哥犯罪数据印度演员数据的年事检测推荐引擎数据VisualQA数据三、初学者项目1.虹膜数据集这可能是模式识别文献中功效最全,最简朴且最有用的数据集。学习分类技术,没有比Iris数据集更简朴的了。

如果您是数据科学的新手,那么这就是您的起点。数据只有150行4列。

问题:凭据可用属性预测花朵的种别,构建Logistic回归模型数据地址:https://archive.ics.uci.edu/ml/datasets/Iris教程:http://www.slideshare.net/thoi_gian/iris-data-analysis-with-r2.贷款预测数据集在所有行业中,保险领域是分析和数据科学方法最大的用途之一。该数据集使您可以从保险公司的数据集中举行操作-那内里临着哪些挑战,使用了什么计谋,哪些变量影响了却果等等。

这是一个分类问题。数据有615行和13列。问题:预测贷款是否会获得批准,构建Logistic回归模型数据地址:https://datahack.analyticsvidhya.com/contest/practice-problem-loan-prediction-iii/教程:https://www.analyticsvidhya.com/blog/2016/01/complete-tutorial-learn-data-science-python-scratch-2/3.Bigmart销售数据集零售是另一个广泛使用分析来优化业务流程的行业。使用数据科学技术可以巧妙地处置惩罚诸如产物放置,库存治理,自界说报价,产物捆绑等任务。

顾名思义,该数据包罗销售商店的生意业务记载。这是一个回归问题。数据具有12个变量的8523行。

问题:预测商店的销售额,构建线性回归模型数据地址:https://datahack.analyticsvidhya.com/contest/practice-problem-big-mart-sales-iii/教程:https://www.analyticsvidhya.com/blog/2016/02/bigmart-sales-solution-top-20/4.波士顿住房数据集这是模式识别文献中另一个盛行的数据集。数据集来自美国波士顿的房地产行业。这是一个回归问题。数据具有506行和14列。

因此,这是一个很是小的数据集,您可以在其中实验任何技术而不必担忧条记本电脑的内存被过分使用。问题:预测所有者占用衡宇的中位数数据地址:https://www.cs.toronto.edu/~delve/data/boston/bostonDetail.html教程:https://www.analyticsvidhya.com/blog/2015/11/started-machine-learning-ms-excel-xl-miner/5.时间序列分析数据集时间序列是数据科学中最常用的技术之一。它具有广泛的应用法式-天气预报,预测销售,分析逐年趋势等。

此数据集特定于时间序列,而此处的挑战是以一种运输方式预测交通量。数据具有**行和**列。

问题:以新的运输方式预测交通量数据地址:https://datahack.analyticsvidhya.com/contest/practice-problem-time-series-2/教程:https://trainings.analyticsvidhya.com/courses/course-v1:AnalyticsVidhya+TS_101+TS_term1/about6.葡萄酒质量数据集这是数据科学初学者中最受接待的数据集之一。它分为2个数据集。您可以对此数据执行回归和分类任务。它将测试您在差别领域的明白-异常检测,特征选择和不平衡数据。

该数据集中有4898行和12列。问题:预测葡萄酒的质量数据:https://archive.ics.uci.edu/ml/datasets/Wine+Quality教程:https://web.stanford.edu/~ilker/doc/wine_Stats315A.pdf7.Turkiye学生评估数据集该数据集基于学生针对差别课程填写的评估表。它具有差别的属性,包罗出勤率,难度,每个评估问题的得分等。

这是一个无监视的学习问题。数据集有5820行和33列。

问题:使用分类和聚类技术来处置惩罚数据数据:https://archive.ics.uci.edu/ml/datasets/Wine+Qualityhttps://archive.ics.uci.edu/ml/datasets/Turkiye+Student+Evaluation教程:https://sanghosuh.github.io/research/LA_EdMining_SanghoSuh.pdf8.身高和体重数据集这是一个很是简朴的问题,很是适合刚开始使用数据科学的人们。这是一个回归问题。数据集具有25,000行和3列(索引,高度和权重)。问题:预测一小我私家的身高或体重。

数据:http://wiki.stat.ucla.edu/socr/index.php/SOCR_Data_Dinov_020108_HeightsWeights教程:https://www3.nd.edu/~steve/computing_with_data/2_Motivation/motivate_ht_wt.html。


本文关键词:24个,提高,您的,知识,和,技术,的,机械,学习,一,leyu乐鱼体育官网

本文来源:乐鱼体育官网登录-www.dgjgzp.com