 首页 > 业内资讯 > 经验 : 三个你在书中无法学到的数据分析知识。

创世纪.神 V1.0 安卓版

幽游白书武术会 v1.0.0 安卓版

幽游白书武术会 v1.0.0 安卓版

阴阳师妖怪屋 V1.1.0 安卓版

阴阳师妖怪屋 V1.1.0 安卓版

怒剑传说 V1.0 安卓版

远征2最新版 V1.0.1 安卓版

远征2最新版 V1.0.1 安卓版

顽石英雄 V1.0.1 安卓版

顽石英雄 V1.0.1 安卓版

迷你装甲 V1.1.0 安卓版

迷你装甲 V1.1.0 安卓版

魔法学徒的一天游戏 V1.0 安卓版

魔法学徒的一天游戏 V1.0 安卓版

白蛇仙劫 V1.0.1 安卓版

白蛇仙劫 V1.0.1 安卓版

经验 : 三个你在书中无法学到的数据分析知识。

时间：2015-12-08　|　来源：数据挖掘与数据分析　|　阅读：174

话题：数据挖掘与数据分析

教科书往往只提供一些看起来很强大的方法，你需要用数据测试一下就能得出结果，这也可能是从理论观点和数据源来说是对的，但是在现实中，数据和我们的时间是有限的，所以寻找大信息量的特点是非常有必要的。

三、选型大多数是看周期，而不是数据集的大小。

你不想在大数据时代过多的表达自己的观点，但是大多数数据会完美的融入你的主内存。你的方法可能不会在跑数据上花费很长时间，但是你会花很多时间从原始数据中提取出特征，进行交叉验证。为你的学习方法比较不同特征提取管道和参数。

对于模型的选择，你可以通过大量的参数组合，评估一个相同的数据副本的性能。现在的问题就是所有的组合爆炸，比方说你有两个参数，它需要大约一分钟来训练你的模型，并获得一个结果来评估数据集的性能。如果每一个参数有5个候选数值，并且执行5倍交叉验证（把数据分割成5部分，测试5次，在每次迭代中使用不同的数据来测试），这意味着你需要运行25次来找出哪种方法的效果更好，这可能需要花费两个小时的时间。

好消息是这是很容易并行化的，因为不同的运行是完全相互独立的。这同样适用于特征提取，您通常使用相同的操作（解析，提取，转换等），以每个数据独立设置，导致一些“ 密集并行”（是的，这是一个技术术语）。

坏消息是这对做数据分析的人来说是很多的，因为所有的这些意味着对复杂办法实现拓展实现是没有什么需求的，但是对于储存的并行数据运用一些相同的算法在大多数情况下都非常有帮助。

最后有很多数据并不意味着你需要所有的数据，问题是有关于潜在学习问题的复杂性。如果这个问题可以用一个简单的模型解决，你就不需要用那么多的数据来推断模型的参数。这种情况下，采用数据的随机子集可能会有很大的帮助。正如我上面所说的，有时候正确的共您可以帮助他们减少所需要的数据点的数量。

总之知道如何正确的评价可以帮助你减少一个方法不能应用与未来数据的风险。获取正确的特征提取可能是最有效的方法来获得最好的结果。最后。并不总是大数据，分布式计算也可以帮助你。

转自：中国统计网；作者：hong。

版权声明：本号内容部分来自互联网，转载请注明原文链接和作者，如有侵权或出处有误请和我们联系。

小编推荐

BAT疯抢2.19亿二次元用户，90后为谁买单？麦肯锡压箱底的10个经典方法！可视性与策略：云如何帮助增强IT安全性报告显示：2016互联网数据分析人才高度稀缺北京到底有多大？居然......这么大！

视频推荐

更多 

首页上一页 1 2 3

麦轲数据管家V4.02 绿色版

TOP

软件

53

麦轲数据管家运营中: 麦轲数据管家：个人数据管理软件。; 10.93 MB 10.27 赞(950); 安全无广告 需网络

 立即下载

推荐

最新好玩手游

更多 

手游风云榜

更多 

月神宝藏(送GM商城) V1.0 安卓版

月神宝藏(送GM商城) V1.0 安卓版

373.35 MB

君临城下(送GM万充) V1.0 安卓版

君临城下(送GM万充) V1.0 安卓版

786.4 MB

悠唐天下(炸服GM神卡) V1.0 安卓版

悠唐天下(炸服GM神卡) V1.0 安卓版

502.03 MB

伏魔诀（无限送真充） V1.0 安卓版

伏魔诀（无限送真充） V1.0 安卓版

234.08 MB

天空之息 V1.0 安卓版

155.99 MB

纯三国送无限资源 V1.0 安卓版

纯三国送无限资源 V1.0 安卓版

640.8 MB

思仙 V1.5.6 安卓版

521 MB

仙语奇缘连抽版 v1.0.4 安卓版

仙语奇缘连抽版 v1.0.4 安卓版

98.7 Bytes

校花的贴身高手天阶岛福利版 V1.0 安卓版

校花的贴身高手天阶岛福利版 V1.0 安卓版

646.7 MB

阿拉德之怒 V5.2.3 安卓版

阿拉德之怒 V5.2.3 安卓版

235.76 Bytes

群英之战 V1.0 安卓版

362 MB

闪烁之光 V1.9.7 安卓版

闪烁之光 V1.9.7 安卓版

296.7 MB

决战玛法 V7.5.0 安卓版

决战玛法 V7.5.0 安卓版

543 MB

资讯阅读

更多 

《热血江湖手游技能加点攻略》（掌握技能加点要诀，成就无敌江湖之王）

业内资讯  2025-05-21
新版本赏金玩法出装攻略（全面解析最优出装方案，让你在新版本赏金玩法中独领风骚）

业内资讯  2025-05-20
老鼠铲子出装铭文攻略（打造无敌老鼠！）

业内资讯  2025-05-20
王者太虚战场出装攻略（打造最强装备，征服太虚战场）

业内资讯  2025-05-19
制裁战神队友出装攻略（打造最强战队，击败敌人无往不胜）

业内资讯  2025-05-19
《狐狸端游联盟出装攻略》（狐狸出装攻略，助你战胜对手！）

业内资讯  2025-05-18
王者荣耀（揭开哪吒输出利器，带你稳定carry全场）

业内资讯  2025-05-18
地狱男爵技能加点攻略

业内资讯  2025-05-16
逐梦三国（揭秘孙权如何在起凡中成为绝对强者）

业内资讯  2025-05-16
《凯德出装铭文推荐攻略，助你稳定击败对手》

业内资讯  2025-05-13
护卫乌龟出装攻略（如何选择适合乌龟的护卫出装）

业内资讯  2025-05-11
《公主级2-6攻略技能大揭秘》（掌握攻略技能，成为公主级2-6的王者！）

业内资讯  2025-05-08

查看更多

湘ICP备2022002427号-10 湘公网安备：43070202000427号
© 2013~2024 haote.com 好特网