大数据第六天

发布于:2024-04-27 ⋅ 阅读:(25) ⋅ 点赞:(0)

问题

FAILED: ParseException line 1:16 mismatched input ‘input’ expecting INPATH near ‘local’ in load statement
MismatchedTokenException(24!=155)

加载数据的时候出现了这个错误,我们解释一个这个错误是什么,具体说的是语法有问题,需要我们修改语法问题

失败:ParseException行1:16输入“input”不匹配,在load语句中应为靠近“local”的INPATH
MismatchedTokenException(24!=155)

这个翻译的原文

我导入的文件
在这里插入图片描述
这个才是正确的数据格式
在这里插入图片描述

解决问题

发现解决不了

这里写的就是有问题
错误的写法是 Input
正确的是 inpath
在这里插入图片描述

总是出现这个错误,我不知道怎么了

在这里插入图片描述
我就是在这个服务器上面还是还是没有成功

在这里插入图片描述
使用这个方式突然成功了

在这里插入图片描述
数据也没有问题

在这里插入图片描述

创建数据集表
在这里插入图片描述
数据
在这里插入图片描述
上传
在这里插入图片描述
结果

查询插入(时间慢)

INSERT INTO table student04 select id,name from student01 ;

在这里插入图片描述
这个时间大概有一个1分钟了把

练习sql

选择库

use test;

创建数据表的方式

CREATE table student04(
id int,
namet string
)
row format delimited
fields terminated by ',';

数据格式

在这里插入图片描述

加载本地数据库

load data local input '/root/hivedata/student.txt' into table student;

数据清理

有一些数据为空我们不需要如何进行处理的方式
在这里插入图片描述

我们只想要获取时间数据的方式
在这里插入图片描述

经纬度是一个数据如何分成俩个数据的方式
在这里插入图片描述

清理为空的数据
LENGTH(sender_gps) = 0

SELECT msg_time,sender_name,sender_gps from 
tb_msg_source 
WHERE  LENGTH(sender_gps) = 0
limit 10

获取时间段的数据
SUBSTR(msg_time,12,16)

select SUBSTR(msg_time,12,16) from tb_msg_source limit 10; 

分割数据的方式
split(sender_gps,“,”)[1]

SELECT split(sender_gps,",")[1] from tb_msg_source 

网站公告

今日签到

点亮在社区的每一天
去签到