我有千万条数据,表结构该如何设计?


假设我有 10,000,000 条数据,
所以数据一共有100 个类别
如果查询的场景通常是把所有类别的数据跨类别的都取出来,数据库该怎么设计比较好
A 是按类别分成 100 张表,查询的时候从这100张表分别查;
B 全部存在一个表中

请别说做分布式之类的方法。现在想的是程序部分的设计,还不涉及系统的架构。假设我就有一台服务器。
类型是个 int, 我目前担心的是,如果分成一百个表,同时查这 100 个表会不会很慢。

id flow_type_id state owner
1 85 2 100012

数据大概是这种感觉。

mysql 数据库设计 oracle

Dead白猫 9 years, 8 months ago

mysql自身单表千万承载能力还是可以的。
不过你的详细的数据样本呢?就只有分类么?分类是字符串么?

id category name
1 cat1 name1
2 cat2 name2

 select * from table where category in ('cat1','cat2')

update

flow_type_id 增加索引后使用in查询速度还是很感人的。千万级无需考虑分表问题,即便需要联合 state owner 查询设置三个字段为 符合 复合索引即可。

涉及到分表处理的话作为一个成熟的系统考虑中间件等架构级别的设计方案是必须的。比如 mysql-proxy 分表查询在其内部就已经完成,国产的 OneProxy 更是支持内部并行查询,这样的效率是不必担心的(加个中间件而已)

Ps:如果有条件,可以尝试一下PostgreSQL。

IceMoon answered 9 years, 8 months ago

Your Answer