oraclehashjoin原理及注意事项有哪些

oracle hash join原理及注意事项有哪些,针对这个问题,这篇文章详细介绍了相对应的分析和解答,希望可以帮助更多想解决这个问题的小伙伴找到更简单易行的方法。

创新互联公司专注于企业网络营销推广、网站重做改版、贾汪网站定制设计、自适应品牌网站建设、H5建站商城网站制作、集团公司官网建设、成都外贸网站建设、高端网站制作、响应式网页设计等建站业务,价格优惠性价比高,为贾汪等各大城市提供网站开发制作服务。

7.3引入,仅用于CBO和等值连接,隐含参数_hash_join_enabled默认true,即使为false也可被use_hash覆盖;
Oracle依据hash_area_size/db_block_size/_hash_multiblock_io_count决定hash partition数量,hash表由若干hash partition组成,而每个partition都包含多个hash bucket

表small和big,前者会被选为驱动表,假定其结果集为s,后者为b;
构造驱动表
1 遍历s,对其每条记录按照连接列做hash运算;使用2个hash函数,暂称为func_1/func_2,其hash值为value1和value2;
2 按照value1分配bucket,把s和value2存入其中;只需查询列/连接列即可,不需要整行记录;构造hash partition时每个分区对应1个bitmap,标注该分区所属bucket是否有记录;
3 如果s > hash_area_size,将包含记录最多的partition存入temp,反复直至完成;
4 按记录数对hash partition排序,当s > hash_area_size,则尽量将较小的partition保留内存中;
构造被驱动表
5 遍历b,处理方式与步骤1一样;
6 按照value1匹配s的bucket,然后遍历其所有记录,并校验连接列是否相等;如果成功则返回记录;如果没有在内存中找到bucket,首先访问bitmap,若其记录数>0,暂将b中对应记录写入temp,若=0则直接跳过,即位图过滤;反复直至完成所有位于内存中的s和b的记录;
7 处理temp中的si和bj,分区号相等的结成对sn/bn,记录数较少的作驱动表,以value2构造hash table;反复直至完成


注意事项
1 驱动表连接列的选择性要高,若一个bucket的记录数过多,遍历时会严重消耗CPU且逻辑读不高(位于PGA中),可参照http://www.dbafan.com/blog/?p=151
2 驱动表应尽可能小,最好可全部装入内存hash_area_size


10104事件
跟踪hash join,记录hash partition/bucket以及每个bucket多少条记录


Hint
use_hash(table_1 table_2) 与 use_hash(table_1) + use_hash(table_2)等价,即并不决定连接顺序;
no_swap_join_inputs(rowsource_alias)和swap_join_inputs(rowsource_alias) 可指定驱动表和被驱动表,后者不可swap;

select  /*+ leading(table_1 table_2) use_hash(table_2) no_swap_join_inputs(table_2) */ *
from    t1 table_1, t2 table_2
where   table_1.n1 = table_1.n1;
-----------------------------------------------------------
| Id  | Operation          | Name | Rows  | Bytes | Cost  |
-----------------------------------------------------------
|   0 | SELECT STATEMENT   |      | 45000 |    16M|    44 |
|*  1 |  HASH JOIN         |      | 45000 |    16M|    44 |
|   2 |   TABLE ACCESS FULL| T1   |  3000 |   547K|    14 |
|   3 |   TABLE ACCESS FULL| T2   |  3000 |   547K|    14 |
-----------------------------------------------------------

select  /*+ leading(table_1 table_2) use_hash(table_2) swap_join_inputs(table_2) */ *
from    t1 table_1, t2 table_2
where   table_1.n1 = table_1.n1;

-----------------------------------------------------------
| Id  | Operation          | Name | Rows  | Bytes | Cost  |
-----------------------------------------------------------
|   0 | SELECT STATEMENT   |      | 45000 |    16M|    44 |
|*  1 |  HASH JOIN         |      | 45000 |    16M|    44 |
|   2 |   TABLE ACCESS FULL| T2   |  3000 |   547K|    14 |
|   3 |   TABLE ACCESS FULL| T1   |  3000 |   547K|    14 |
-----------------------------------------------------------

关于oracle hash join原理及注意事项有哪些问题的解答就分享到这里了,希望以上内容可以对大家有一定的帮助,如果你还有很多疑惑没有解开,可以关注创新互联行业资讯频道了解更多相关知识。


分享文章:oraclehashjoin原理及注意事项有哪些
网址分享:http://hbruida.cn/article/pcsjpd.html