因为 Hive 的元数据总得需要持久化到一个地方去。默认是存到内嵌的 Derby 数据库(类似 SQLite,但是 Java 写的)里,缺点很多,不一一说了,只适合测试用。生产里你就得找个靠谱的数据库了,并没有要求一定是 MySql,实际上你用 PostgreSQL / Oracle / MSSQL 啥的都行,只不过 MySql 社区比较活跃、所以你看到的就更多一些而已。我猜你是本机同时安装的 Hive 和 Hadoop,默认是本地模式,从 HADOOP_HOME 里找。生产里 Hadoop 都是集群的,你当然得配置了。
因为 Hive 的元数据总得需要持久化到一个地方去。
默认是存到内嵌的 Derby 数据库(类似 SQLite,但是 Java 写的)里,缺点很多,不一一说了,只适合测试用。生产里你就得找个靠谱的数据库了,并没有要求一定是 MySql,实际上你用 PostgreSQL / Oracle / MSSQL 啥的都行,只不过 MySql 社区比较活跃、所以你看到的就更多一些而已。
我猜你是本机同时安装的 Hive 和 Hadoop,默认是本地模式,从
HADOOP_HOME
里找。生产里 Hadoop 都是集群的,你当然得配置了。