图表:数据量级差异大的处理
如何有效处理特征范围差异大且类型不一的数据?
- 特征类型混杂: 连续变量,离散变量,描述变量共存
- 不同变量之间取值差异大: 例如有些变量取值在0~1但有些取值为10000-50000
归一化

对数折线图
连续型的特征,如果都是正的,且分布偏向较小的值,可以考虑取对数。
如highcharts: type: ‘logarithmic’,
var chart = Highcharts.chart('container', {title: {text: '2010 ~ 2016 年太阳能行业就业人员发展情况'},subtitle: {text: '数据来源:thesolarfoundation.com'},yAxis: {title: {text: '就业人数'},type: 'logarithmic',},legend: {layout: 'vertical',align: 'right',verticalAlign: 'middle'},plotOptions: {series: {label: {connectorAllowed: false},pointStart: 2010}},series: [{name: '安装,实施人员',data: [43934, 52503, 57177, 69658, 97031, 119931, 137133, 1577774175]}, {name: '工人',data: [24916, 24064, 29742, 29851, 32490, 30282, 38121, 40434]}, {name: '销售',data: [11744, 17722, 16005, 19771, 20185, 24377, 32147, 39387]}, {name: '项目开发',data: [null, null, 7988, 12169, 15112, 22452, 34400, 34227]}, {name: '其他',data: [12908, 5948, 8105, 11248, 8989, 11816, 18274, 18111]}],responsive: {rules: [{condition: {maxWidth: 500},chartOptions: {legend: {layout: 'horizontal',align: 'center',verticalAlign: 'bottom'}}}]}
});

如果各个特征的取值范围差别很大,而你的模型对取值范围的差别又比较敏感,可以考虑归一化。
本文来自互联网用户投稿,文章观点仅代表作者本人,不代表本站立场,不承担相关法律责任。如若转载,请注明出处。 如若内容造成侵权/违法违规/事实不符,请点击【内容举报】进行投诉反馈!
