「Python 面试」第五次更新

图片描述

阅读本文大约需要 8 分钟。

写在前面

数据库打算只写 MySQL，Redis 两部分，不会很细，主要以面试题为主。这次写的是 MySQL 篇。

1.说一下 char、varchar 、text 的区别

这里先介绍一下数据库的概念，数据库是一种数据结构，内含多种算法，帮助我们将数据以最优化的方式存储在计算机中，也可以帮助我们快速找到存储的数据。

数据最终存储在计算机中都是以「二进制」的方式存储。比如 4，存储在计算机中其实是以 0100 的方式存储。比如 A，存储在计算中是以 0100 0001 的方式存储。

char：定长字符型，最大可存储 255 （2 的 8 次方）个字节长度，可以理解成最大可以存储 255 个字符。在计算机中以 8 位二进制的方式存储。

使用char类型存储数据时，假设存储的数据是 4，4 在计算机中存储的结果是 0000 0100，意味着使用定长字符型char，不管你存储的值是多少位，最终在计算机里都是以 8 位二进制的方式存储，不满 8 位，前面补 0。超过 8 位，超出的部分会被去除。

也就是说当使用char字符型存储数据后，该数据转换为二进制时的长度超过了 8 位，那么该数据将不会完整存储，会「丢失」一部分数据。

varchar：不定长字符型，最大可存储 65535（2 的 16 次方）个字节长度，在计算机中以 16位二进制的方式存储。

它与char不同的地方在于，当字符长度在 0-255 以内时，会在后面添加一个字节，超过 255 时，添加两个字节。同样的，当超过最大存储长度后，也会丢失一部分数据。

text：长文本数据类型，最大可存储 65555 个字节长度，不能指定长度，也就是说不支持text(num)。

但是该类型尽量不要使用，因为text类型数据在检索中，不会使用索引，而是使用全局搜索，这会产生临时表，使得检索时间变长，不推荐使用。

由于char和varchar的特性，在实际使用当中，如果该数据是经常会发生变化、经常使用的，那么推荐使用char类型，因为 MySQL 在对数据进行排序时，会根据该数据的长度来排，固定长度的char类型会提供更高的性能。但是由于固定长度的特性，在存储短数据时，一定程度上也会造成资源浪费，算是一个双刃剑。

2. varchar（100）中的 100 有什么意义

100 只是在呈现角度上定义的，比如该数据有 120 个字符，那么你在查询该数据时，看到的只有 100 个。但是如果在定义时，添加了UNSIGNED ZEROFILL属性，那么这将改变该类型的最大存储长度。

同样的，在实际使用当中，varchar(num)里的值不需要定义的特别长，只要够用就行，具体原因上面有提，这里不再赘述。

3. 说一说 DROP、DELETE、TRUNCATE 的区别

DORP：非事务操作，彻底删除一张表，无法反悔恢复。

DELETE：事务操作，删除表里的一行或多行数据，如果反悔或是误删，可以通过「事务回滚」恢复该表。不会影响该表下的view或索引。

TRUNCATE：非事务操作，删除表里的某行数据，或是删除整张表的数据（表依然存在，只是成了一张空表）。无法反悔恢复，并且会将该表下的view或索引重置。

执行速度：DROP > TRUNCATE > DELETE。

4. 说一说 MySQL 三范式

第一范式：表中的字段只能表达一种意思，不能模棱两可。

第二范式：表必须含有一个唯一主键来标识这张表。

第三范式：表中的字段不能互相依赖。

5. 说一说 MySQL 中如何分区、分表

Scale Out（垂直切分）

Scale Up（横向拆分）

这里有篇文章值得看一看。MySQL 分区、分表

6. 了解索引吗

如果把数据库当做一本书的话，那么索引就是书的「目录页」，通过目录，我们可以快速定位查找内容，同样的，目录页在书中也占了一页纸，所以索引是一个数据结构，也要占据数据库物理内存。

索引分为 4 种类型：普通索引、唯一索引、主键索引和全文索引（MyISAM 专有）。

索引的创建规则：经常使用的字段名，和出现在 where 后面的字段名，建议为它们创建索引，索引要遵循最左前缀原则（最能体现该索引特征，也就是常用的字段放最左边）。

索引的原理：可以看看这篇文章。索引

索引的使用场景：中等、大量数据时，使用索引效率会非常高，小型数据不建议使用索引，没有全局搜索来的快。

索引的作用：索引可以提高查询速度。但是索引会增加数据库存储额外开销。索引会将数据库查询时的随机 I/O 变成顺序 I/O，减少服务器排序操作，和临时表的开销。

7. 说一下常用的 MySQL 优化手段

使用EXPLAIN查看 SQL 执行计划，帮助自己查看哪些地方可以优化。
杜绝使用 SELECT * FROM xxx 这种查询语句，需要什么就查什么。
尽量不要使用text这种类型，这会使得数据查询该字段时，创建临时表。
明确知道查询数据结果大概有几行时，使用LIMIT，为查询结果限制显示页数。
避免使用 MySQL 的内置函数。
尽量使用 EXISTS和BETWEEN代替IN。
避免在 WHERE中使用表达式操作，这会使得 MySQL 放弃使用索引查询。
尽量使用小表驱动大表（从小的表中，查找跟大表中有关系的数据），可以减少 CPU 运算次数，以及 I/O 总量。
尽量使用INNER JOIN而不是LEFT JOIN，因为前者默认使用小表驱动大表。
索引要遵循最左前缀法则。
避免使用模糊查询LIKE。
避免设置字段NULL属性，在对NULL进行判断时，会使得 MySQL 放弃使用索引。

8. InnoDB 和 MyISAM 的区别

InnoDB 支持外键，MyISAM 不支持。
MyISAM 拥有全文索引，InnoDB 没有。
数据库崩溃后，InnoDB 可以安全恢复，而 MyISAM 不可以。
InnoDB 拥有事务，而 MyISAM 没有。
InnoDB 拥有行锁，而 MyISAM 拥有表锁。
MyISAM 计算 COUNT(*)时，速度远高于 InnoDB。

9.什么是事务

InnoDB 引擎下，MySQL 支持事务操作，事务拥有以下几个特点：

原子性
可靠性
稳定性
隔离性

使用事务的操作，要么执行，要么不执行，只有一个结果，但是事务可以回滚，也就是撤回操作。

10.说一下悲观锁、乐观锁

InnoDB 引擎下的 MySQL 在处理高并发时，会对 MySQL 数据库添加锁机制，以此完成并发的要求，并保证数据的完整性，可靠性。

悲观锁是 MySQL 为数据库添加行锁，强行为多个事务排序，阻塞事务运行，解决事务之间的冲突问题，但是事务之间有可能出现长时间等待，且开锁、解锁需要额外的数据库资源消耗。所以要谨慎使用。

乐观锁没有锁机制，但是引入了版本号控制，在高并发时，数据库在事务提交之前会进行版本号校验，如果版本后前后不一致，说明此刻有其他事务正在操作，那么本次事务重新操作。

版本号的好处在于没有锁的开销，并且只在事务最后提交更改时进行判断，但是也要考虑重新执行的代价是否过大。

总的来说，高并发下，读操作多的时候，使用乐观锁，写的操作时，使用悲观锁。

未更完，下次更新补上。

「Python 面试」第五次更新

写在前面

1.说一下 char、varchar 、text 的区别

2. varchar（100）中的 100 有什么意义

3. 说一说 DROP、DELETE、TRUNCATE 的区别

4. 说一说 MySQL 三范式

5. 说一说 MySQL 中如何分区、分表

6. 了解索引吗

7. 说一下常用的 MySQL 优化手段

8. InnoDB 和 MyISAM 的区别

9.什么是事务

10.说一下悲观锁、乐观锁

PythonDeveloper

引用和评论

「Python 面试」第六次更新

如何减少跨团队交付摩擦？——基于 DevOps 与敏捷的最佳实践

科学计算编程涉及到的技术栈简介

使用 chardet 判断文件编码需要注意的坑——过大的文件会导致高耗时

Python3 格式化时间（qbit）

本地使用PaddleOCR进行图片识别获得文字（返回JSON）

manus 的替代品有哪些？使用LLM大模型技术做手机/网页/浏览器自动化操作技术汇总