431 to 440 of 720 结果
2018-6-7 -
Replication Data for: 参赛论文-基于校园大数据的学生多维画像分析
MS Excel - 465.2 KB - MD5: 5f9bd8923f8e6caf8d16e3cc26ad3d6b
数据位厦门大学软件学院的学生数据,从:一卡通消费数据,图书馆借阅数据,门禁进出数据,自习室自习数据等原数据提取后,加以清洗和相关处理。 |
MS Excel - 332.5 KB - MD5: 7f659b7e24960cb672878f7fd79f5583
|
MS Excel - 7.6 MB - MD5: 0c3e148064f8f5c641f1046a3a208d2e
|
MS Excel - 1.5 MB - MD5: ab7af7c83f08482732ed3f6aa45ea724
|
MS Excel - 1.5 MB - MD5: d1719bda9194ff205cbed67c1b1d47ef
|
MS Excel - 1.5 MB - MD5: e21601abda29072a035d944c2d44f5e0
|
MS Excel - 983.2 KB - MD5: c7dfbcebac9756b0abb1ddc083b09616
|
MS Excel - 469.2 KB - MD5: 69371a50800bb25cddd530ea37a83163
|
MS Word - 84.0 KB - MD5: cc528a90f38eb64d0f702172df129899
|
2018-6-7 -
Seattle House Prices Hedonic Model
MS Excel - 3.2 MB - MD5: 9c1494861d8105dad436cc010e4a5539
西雅图房屋价格销售记录
数据来源:https://www.kaggle.com/harlfoxem/housesalesprediction/data
数据处理:
1.有序数据二值化
将填充过后的yr_renovated(重装修年份)转换为标称数据,0代表未重新装修过,1代表重新装修过。
2.去除离群值
根据在数据理解中所发现的bedrooms, sqft_lot, sqft_living以及sqft_lot15, sqft_living15变量存在的离群点进行识别,将其删除。
3.日期数据格式问题
对日期原本字符串“YYYYMMDDT... |