Hibernate性能调优
- 格式:doc
- 大小:45.00 KB
- 文档页数:9
hibernate的基本用法Hibernate是一个开源的Java框架,用于简化数据库操作。
它为开发人员提供了一个更加简单、直观的方式来管理数据库,同时也提高了应用程序的性能和可维护性。
本文将逐步介绍Hibernate的基本用法,包括配置、实体映射、数据操作等。
一、配置Hibernate1. 下载和安装Hibernate:首先,我们需要下载Hibernate的压缩包并解压。
然后将解压后的文件夹添加到Java项目的构建路径中。
2. 创建Hibernate配置文件:在解压后的文件夹中,可以找到一个名为"hibernate.cfg.xml"的文件。
这是Hibernate的主要配置文件,我们需要在其中指定数据库连接信息和其他相关配置。
3. 配置数据库连接:在"hibernate.cfg.xml"文件中,我们可以添加一个名为"hibernate.connection.url"的属性,用于指定数据库的连接URL。
除此之外,还需要指定数据库的用户名和密码等信息。
4. 配置实体映射:Hibernate使用对象关系映射(ORM)来将Java类映射到数据库表。
我们需要在配置文件中使用"mapping"元素来指定实体类的映射文件。
这个映射文件描述了实体类与数据库表之间的对应关系。
二、实体映射1. 创建实体类:我们需要创建一个Java类,用于表示数据库中的一行数据。
这个类的字段通常与数据库表的列对应。
同时,我们可以使用Hibernate提供的注解或XML文件来配置实体的映射关系。
2. 创建映射文件:可以根据个人喜好选择使用注解还是XML文件来配置实体类的映射关系。
如果使用XML文件,需要创建一个与实体类同名的XML文件,并在其中定义实体类与数据库表之间的映射关系。
3. 配置实体映射:在配置文件中,我们需要使用"mapping"元素来指定实体类的映射文件。
1、jsp和servlet的区别、共同点、各自应用的范围??JSP是Servlet技术的扩展,本质上就是Servlet的简易方式。
JSP编译后是“类servlet”。
Servlet和JSP最主要的不同点在于,Servlet的应用逻辑是在Java文件中,并且完全从表示层中的HTML里分离开来。
而JSP的情况是Java和HTML可以组合成一个扩展名为.jsp的文件。
JSP侧重于视图,Servlet主要用于控制逻辑。
在struts框架中,JSP位于MVC设计模式的视图层,而Servlet位于控制层.2、cookie和session的作用、区别、应用范围,session的工作原理Cookie:主要用在保存客户端,其值在客户端与服务端之间传送,不安全,存储的数据量有限。
Session:保存在服务端,每一个session在服务端有一个sessionID作一个标识。
存储的数据量大,安全性高。
占用服务端的内存资源。
3、jstl是什么?优点有哪些??JSTL(JSP Standard Tag Library,JSP标准标签库)是一个不断完善的开放源代码的JSP标签库,由四个定制标记库(core、format、xml和sql)和一对通用标记库验证器(ScriptFreeTLV和PermittedTaglibsTLV)组成。
优点有:最大程序地提高了WEB应用在各应用服务器在应用程序服务器之间提供了一致的接口,最大程序地提高了1、在应用程序服务器之间提供了一致的接口,之间的移植。
2、简化了JSP和WEB应用程序的开发。
3、以一种统一的方式减少了JSP中的scriptlet代码数量,可以达到没有任何scriptlet 代码的程序。
在我们公司的项目中是不允许有任何的scriptlet代码出现在JSP中。
4、允许JSP设计工具与WEB应用程序开发的进一步集成。
相信不久就会有支持JSTL的IDE 开发工具出现。
4、j2ee的优越性主要表现在哪些方面?MVC模式a、J2EE基于JAVA技术,与平台无关b、J2EE拥有开放标准,许多大型公司实现了对该规范支持的应用服务器。
数据库查询性能优化的关键指标与性能调整方法总结数据库是现代应用中关键的数据存储和操作引擎,而数据库查询性能则是保障业务运转高效的关键。
本文将分析数据库查询性能优化的关键指标和性能调整方法,以帮助读者理解并改善数据库查询性能问题。
一、关键指标1. 响应时间:即数据库查询的耗时。
响应时间是用户获得查询结果所需的时间,需要尽量缩短以提高用户体验和整体系统性能。
2. 并发性能:并发性能衡量数据库系统同时处理多个查询请求的能力。
较高的并发性能可同时响应大量查询请求,提供更好的用户体验。
3. 吞吐量:吞吐量是指在一定时间内数据库能处理的查询请求数量。
较高的吞吐量代表数据库的工作效率较高。
4. 资源占用:数据库执行查询所需的系统资源,包括 CPU、内存和磁盘IO 等。
合理利用资源是优化查询性能的关键。
5. 索引命中率:索引命中率即查询时需要的数据是否命中索引进行快速查找。
较高的索引命中率提高了查询速度。
二、性能调整方法1. 优化 SQL 查询语句SQL 查询语句是数据库查询性能优化的重点。
以下是一些常见的 SQL 优化方法:- 使用合适的索引:为经常被查询的字段创建索引可以大大提高查询速度。
但要避免过多的索引,以减少更新操作的性能损耗。
- 优化查询逻辑:设计简洁、高效的查询逻辑,避免不必要的嵌套查询和子查询。
使用更简单的 JOIN 语句替代子查询。
- 调整查询顺序:按照条件的选择性从高到低的顺序进行查询,可以尽早过滤出不满足条件的记录,从而提高查询效率。
- 避免使用 SELECT *:只选择需要的字段,避免查询过多无用的字段,以减少数据传输和处理的负担。
2. 适当增加缓存缓存是提高数据库查询性能的常用方法。
通过将查询结果存储在缓存中,可以减少对数据库的查询次数,从而提高查询性能。
- 查询缓存:数据库的查询缓存可以存储查询结果,当相同查询再次发起时,直接从缓存中获取结果。
但要注意缓存过期时间和频繁更新的表。
- 缓存中间层:可以引入内存数据库、缓存服务器等中间层,将热门数据缓存在内存中,以提高查询速度。
《Java性能调优指南》随着互联网的飞速发展,Java作为一种重要的编程语言,被越来越广泛地应用于各个领域。
但是,Java程序的性能问题也随之出现。
如何调优Java 程序的性能,成为了每个开发人员需要解决的难题。
本文将为大家介绍Java性能调优的指南。
一、JVM参数设置JVM(Java虚拟机)参数设置是Java性能调优的关键。
JVM有众多的参数,不同的参数设置会对Java程序的性能产生不同的影响。
常用的JVM参数设置包括以下几个方面:1. 内存设置内存是Java程序的一大瓶颈。
如果内存设置不合理,会导致Java程序频繁地进行垃圾回收,造成程序的延迟和不稳定。
在设置内存参数时需要注意以下几点:- -Xmx: 最大堆内存,设置合理的最大堆内存大小可以减少JVM的垃圾回收次数,提高程序性能。
- -Xms: 初始堆内存,设置合理的初始堆内存大小可以加快程序启动时间,提高程序性能。
- -XX:NewRatio: 新生代与老年代的比例,如果设置得当,可以减少垃圾回收的次数。
通常新生代的大小为总堆容量的1\/3或1\/4,老年代的大小为总堆容量的2\/3或3\/4。
2. 垃圾回收设置垃圾回收是Java程序中必不可少的一部分。
合理的垃圾回收参数设置可以提高程序性能。
常用的垃圾回收参数设置包括以下几点:- -XX:+UseParallelGC: 使用并行GC,适用于多核CPU。
- -XX:+UseConcMarkSweepGC: 使用CMS GC,适用于大型Web应用程序。
- -XX:+UseG1GC: 使用G1 GC,适用于大内存应用程序。
3. JIT设置JIT(即时编译器)是Java程序中非常重要的一部分。
合理的JIT参数设置可以提高程序的性能。
常用的JIT参数设置包括以下几点:- -XX:+TieredCompilation: 启用分层编译,可以提高程序启动时间和性能。
- -XX:CompileThreshold: JIT编译阈值,设置JIT编译的最小方法调用次数,可以提高程序性能。
数据库性能调优的常见问题与解决方案数据是现代社会的重要组成部分,而数据库是用于存储和管理大量数据的重要工具。
然而,随着数据量的不断增加和应用需求的提高,数据库性能调优变得越来越重要。
本文将介绍数据库性能调优的常见问题,并提供相应的解决方案。
一、索引设计不合理索引是提高数据库查询性能的重要手段,但不合理的索引设计可能导致数据库性能下降。
常见的索引问题包括过多索引、重复索引、索引列选择不当等。
解决方案:1. 评估业务需求,合理选择索引列,避免冗余索引。
2. 针对经常被查询的列创建合适的索引,提高查询效率。
3. 定期分析索引使用情况,删除或优化不必要的索引,避免过度索引。
二、大量数据读取导致性能下降数据库在处理大量数据读取时容易出现性能下降。
常见问题包括缓存未命中、磁盘IO瓶颈、网络传输慢等。
解决方案:1. 设置适当的数据库缓存,提高数据读取命中率。
2. 使用合适的硬件设备,如快速磁盘和高速网络,缓解瓶颈问题。
3. 合理设计数据模型,减少不必要的数据读取量。
三、查询语句写得不优化数据库查询语句的优化对于提高数据库性能至关重要。
常见问题包括全表扫描、不合理的连接查询、使用子查询效率低等。
解决方案:1. 使用合适的查询语句,避免全表扫描。
尽量使用索引列进行查询,减少不必要的数据扫描。
2. 避免使用过多的连接查询,使用内连接代替外连接,或考虑合适的数据库设计。
3. 减少子查询的使用,合理选择表连接的顺序,优化查询语句执行计划。
四、并发访问冲突并发访问是数据库中常见的情况,但过高的并发量和不合理的并发操作可能导致数据库性能下降和数据一致性问题。
解决方案:1. 合理设计数据库事务,避免死锁和数据冲突。
2. 设置合适的并发控制机制,如锁机制、事务隔离级别等,确保并发操作的正确性。
3. 优化数据库并发瓶颈,如增加服务器资源、合理调整并发连接数等。
五、数据库服务器配置不合理数据库服务器的配置对于性能的提升非常关键。
不合理的配置可能导致性能瓶颈和资源浪费。
数据库性能调优的整体流程与方法数据库性能调优是提高数据库系统性能的关键步骤之一。
当数据库系统出现性能问题时,通过调优可以帮助优化查询、提高响应速度、增加系统容量等,从而更好地满足业务需求和用户期望。
本文将介绍数据库性能调优的整体流程与方法,以帮助读者深入了解并掌握这一重要技能。
一、性能调优的整体流程数据库性能调优包含以下几个关键步骤:1. 收集性能指标:首先需要收集数据库系统的性能指标,如CPU利用率、内存利用率、磁盘I/O等。
这些指标反映了数据库系统的运行状况,帮助我们定位性能问题的根本原因。
2. 分析问题症结:根据收集到的性能指标,分析性能问题的症结所在。
可能会发现一些明显的性能瓶颈,如查询慢、连接数过高等。
这一步骤是深入了解问题所在的关键,可以采用数据库监控工具、性能剖析工具等来帮助分析。
3. 优化数据库设计:数据库设计是影响数据库性能的重要因素之一。
根据分析结果,考虑优化表结构、索引设计、数据模型等。
在表结构设计方面,可以进行分表、分区等优化;在索引设计方面,需要权衡索引的创建与维护成本。
4. 优化查询语句:查询语句是数据库性能调优的关键点之一。
通过检查查询语句是否合理、是否有优化空间,优化查询语句的执行计划、避免全表扫描等方式,提高查询效率和性能。
5. 调整系统参数:根据具体的数据库产品,调整相应的系统参数。
数据库产品通常提供了一些性能调优的参数,可以根据实际情况进行调整以达到最佳性能。
比如可以调整数据库缓存大小,设置并发连接数等。
6. 硬件升级与优化:当软件调优无法满足性能需求时,可以考虑进行硬件升级与优化。
这可能涉及增加内存、扩容磁盘空间、更换更高性能的存储设备等方面。
此外,优化网络架构、负载均衡等也可以改善数据库系统的性能。
7. 执行测试与监控:在完成调优后,需要进行系统测试和性能监控,以确保调优效果达到预期。
可以使用模拟负载、压力测试工具进行测试,同时监控性能指标来评估系统的性能状况。
tomcat常用的调优参数Tomcat常用的调优参数Tomcat是一个开源的Java Servlet容器,广泛应用于Java Web 应用程序的部署和运行。
为了提高Tomcat的性能和稳定性,我们可以通过调优参数来优化其配置。
本文将介绍一些常用的Tomcat 调优参数,帮助您更好地配置和优化T omcat服务器。
1. 内存设置- -Xms: 设置JVM的初始堆大小,建议设置为物理内存的1/4或1/3。
- -Xmx: 设置JVM的最大堆大小,建议设置为物理内存的1/2或2/3。
- -XX:MaxPermSize: 设置JVM的永久代大小,建议设置为256MB或512MB。
- -XX:MaxMetaspaceSize: 设置JVM的元空间大小,建议设置为256MB或512MB。
2. 线程设置- maxThreads: 设置Tomcat的最大线程数,建议根据服务器的硬件配置和并发请求数进行调整。
- acceptCount: 设置Tomcat接受请求的队列大小,建议设置为200或300。
- connectionTimeout: 设置Tomcat的连接超时时间,建议设置为30秒或60秒。
3. 连接器设置- protocol: 设置连接器的协议,常用的有HTTP/1.1和AJP/1.3。
- port: 设置连接器的监听端口,建议使用80端口作为HTTP连接器的默认端口。
- maxKeepAliveRequests: 设置每个Keep-Alive连接的最大请求数,建议设置为100或200。
- keepAliveTimeout: 设置Keep-Alive连接的超时时间,建议设置为5秒或10秒。
4. 缓存设置- cacheSize: 设置Tomcat的静态文件缓存大小,建议根据静态文件的数量和大小进行调整。
- cacheTTL: 设置静态文件缓存的过期时间,建议设置为1小时或更长。
- cacheObjectMaxSize: 设置缓存对象的最大大小,建议根据缓存对象的平均大小进行调整。
jvm常用调优参数
JVM是JavaVirtualMachine的缩写,是Java程序运行的核心。
JVM的调优是优化Java应用程序性能的重要一环,其中调优参数的合理设置是关键。
以下是常用的JVM调优参数:
1. -Xms:设置JVM的初始内存大小,默认为物理内存的
1/64。
2. -Xmx:设置JVM的最大内存大小,超出该内存大小后会触发垃圾回收。
3. -Xmn:设置年轻代的大小,一般设置为总内存的1/3或
1/4。
4. -XX:SurvivorRatio:设置年轻代中Eden区和Survivor区的比例,默认值为8。
5. -XX:NewRatio:设置新生代和老年代的比例,默认值为2。
6. -XX:MaxPermSize:设置永久代的大小,一般设置为
256MB。
7. -XX:+UseConcMarkSweepGC:使用CMS垃圾回收器,可以减少内存抖动。
8. -XX:+UseParallelGC:使用并行垃圾回收器,可提高垃圾回收效率。
9. -XX:+HeapDumpOnOutOfMemoryError:当JVM内存溢出时,生成堆转储文件。
10. -XX:+PrintGCDetails:打印垃圾回收的详细信息。
以上是常用的JVM调优参数,通过合理地设置参数,可以优化Java应用程序的性能。
Hibernate工作原理及为什么要用?一原理:1.读取并解析配置文件2.读取并解析映射信息,创建SessionFactory3.打开Sesssion4.创建事务Transaction5.持久化操作6.提交事务7.关闭Session。
8.关闭SessionFactory为什么要用:1. 对JDBC访问数据库的代码做了封装,大大简化了数据访问层繁琐的重复性代码。
2. Hibernate是一个基于JDBC的主流持久化框架,是一个优秀的ORM实现。
他很大程度的简化DAO层的编码工作3. hibernate使用Java反射机制,而不是字节码增强程序来实现透明性。
4. hibernate的性能非常好,因为它是个轻量级框架。
映射的灵活性很出色。
它支持各种关系数据库,从一对一到多对多的各种复杂关系。
二Hibernate 的核心接口及其作用1 Configuration类:配置Hibernate启动Hibernate创建SessionFactory对象2 SessionFactory:初始化Hibernate创建Session对象线程安全—同一实例被多个线程共享重量级:代表一个数据库内部维护一个连接池2.1 openSession():总是创建新的session,需要手动close()2.2 getCurrentSession() : 必须在hibernate.cfg.xml设置session 上下文事务自动提交并且自动关闭session.从上下文环境中获得session,如果当时环境中不存就创建新的.如果环境中存在就使用环境中的,而且每次得到的都是同一个session (在session提交之前,提交之后就是新的了) 应用在一个session中有多个不同DAO操作处于一个事务时3 Session:负责保存、更新、删除、加载和查询对象轻量级--可以经常创建或销毁3.1 Load与get方法的区别:简单理解:load是懒加载,get是立即加载.load方法当使用查出来的对象时并且session未关闭,才会向数据库发sql, get会立即向数据库发sql返回对象3.3 merge(); 合并对象更新前会先select 再更新3.4clear()清空缓存,flush()将session中的数据同步到数据库两者组合使用于批量数据处理3.4Transaction commit() rollback()JPA: java persistence API 提供了一组操作实体bean的注解和API规范SchemaExporthiberante的生成数据库表(及其他ddl)的工具类可以通过这个工具类完成一些ddl四Hibernate查询查询语言主要有:HQL 、QBC (Query By Criteria条件查询) 、 Native SQLHql:1、属性查询2、参数查询、命名参数查询3、关联查询4、分页查询5、统计函数五优化抓取策略连接抓取(Join fetching)使用 OUTER JOIN(外连接)来获得对象的关联实例或者关联集合查询抓取(Select fetching)另外发送一条 SELECT 语句抓取当前对象的关联实体或集合另外可以配置hibernate抓取数量限制批量抓取(Batch fetching)另外可以通过集合过滤来限制集合中的数据量使用session.createFilter(topic.getReplies(),queryString).list();检索策略延迟检索和立即检索(优先考虑延迟检索)N+1问题指hibernate在查询当前对象时查询相关联的对象查询一端时会查询关联的多端集合对象解决方案:延迟加载连接抓取策略二级缓存集合过滤 BatchSize限制记录数量映射建议使用双向一对多关联,不使用单向一对多灵活使用单向一对多关联不用一对一,用多对一取代配置对象缓存,不使用集合缓存一对多集合使用Bag,多对多集合使用Set继承类使用显式多态表字段要少,表关联不要怕多,有二级缓存撑腰Hibernbate缓存机制性能提升的主要手段Hibernate进行查询时总是先在缓存中进行查询,如缓存中没有所需数据才进行数据库的查询.Hibernbate缓存:一级缓存 (Session级别)二级缓存(SessionFactory级别)查询缓存 (基于二级缓存存储相同参数的sql查询结果集)一级缓存(session缓存)Session缓存可以理解为session中的一个map成员, key为OID ,value为持久化对象的引用在session关闭前,如果要获取记录,hiberntae先在session缓存中查找,找到后直接返回,缓存中没有才向数据库发送sql三种状态的区别在于:对象在内存、数据库、session缓存三者中是否有OID临时状态内存中的对象没有OID, 缓存中没有OID,数据库中也没有OID 执行new或delete()后持久化状态内存中的对象有OID, 缓存中有OID,数据库中有OIDsave() load() get() update() saveOrUpdate() Query对象返回的集合游离(脱管)状态内存中的对象有OID, 缓存中没有OID,数据库中可能有OIDflush() close()后使用session缓存涉及三个操作:1将数据放入缓存2从缓存中获取数据3缓存的数据清理4二级缓存SessionFactory级别SessionFactory级别的缓存,它允许多个Session间共享缓存一般需要使用第三方的缓存组件,如: Ehcache Oscache、JbossCache等二级缓存的工作原理:在执行各种条件查询时,如果所获得的结果集为实体对象的集合,那么就会把所有的数据对象根据OID放入到二级缓存中。
Hibernate性能调优关键字: hibernate性能调优一、inverse = ?inverse=false(default)用于单向one-to-many关联parent.getChildren().add(child) // insert childparent.getChildren().delete(child) // delete childinverse=true用于双向one-to-many关联child.setParent(parent); session.save(child) // insert childsession.delete(child)在分层结构的体系中parentDao, childDao对于CRUD的封装导致往往直接通过session接口持久化对象,而很少通过关联对象可达性二、one-to-many关系单向关系还是双向关系?parent.getChildren().add(child)对集合的触及操作会导致lazy的集合初始化,在没有对集合配置二级缓存的情况下,应避免此类操作select * from child where parent_id = xxx;性能口诀:1. 一般情况下避免使用单向关联,尽量使用双向关联2. 使用双向关联,inverse=“true”3. 在分层结构中通过DAO接口用session直接持久化对象,避免通过关联关系进行可达性持久化三、many-to-one关系单向many-to-one表达了外键存储方灵活运用many-to-one可以避免一些不必要的性能问题many-to-one表达的含义是:0..n : 1,many可以是0,可以是1,也可以是n,也就是说many-to-one可以表达一对多,一对一,多对一关系因此可以配置双向many-to-one关系,例如:1. 一桌四人打麻将,麻将席位和打麻将的人是什么关系?是双向many-to-one的关系四、one-to-one通过主键进行关联相当于把大表拆分为多个小表例如把大字段单独拆分出来,以提高数据库操作的性能Hibernate的one-to-one似乎无法lazy,必须通过bytecode enhancement 五、集合List/Bag/Setone-to-many1. List需要维护index column,不能被用于双向关联,必须inverse=“false”,被谨慎的使用在某些稀有的场合2. Bag/Set语义上没有区别3. 我个人比较喜欢使用Bagmany-to-many1. Bag和Set语义有区别2。
建议使用Set六、集合的过滤1. children = session.createFilter(parent.getChildren(), “where this.age > 5 and this.age < 10”).list()针对一对多关联当中的集合元素非常庞大的情况,特别适合于庞大集合的分页:session.createFilter(parent.getChildren(),“”).setFirst Result(0).setMaxResults(10).list();七、继承关系当中的隐式多态HQL: from Object1. 把所有数据库表全部查询出来2. polymorphism=“implicit”(default)将当前对象,和对象所有继承子类全部一次性取出3. polymorphism=“explicit”,只取出当前查询对象八、Hibernate二级缓存著名的n+1问题:from Child,然后在页面上面显示每个子类的父类信息,就会导致n条对parent表的查询:select * from parent where id = ?.......................select * from parent where id = ?解决方案1. eager fetch2. 二级缓存九、inverse和二级缓存的关系当使用集合缓存的情况下:1. inverse=“false”,通过parent.getChildren()来操作,Hibernate维护集合缓存2. inverse=“true”,直接对child进行操作,未能维护集合缓存!导致缓存脏数据3. 双向关联,inverse=“true”的情况下应避免使用集合缓存十、Hibernate二级缓存是提升web应用性能的法宝OLTP类型的web应用,由于应用服务器端可以进行群集水平扩展,最终的系统瓶颈总是逃不开数据库访问;哪个框架能够最大限度减少数据库访问,降低数据库访问压力,哪个框架提供的性能就更高;针对数据库的缓存策略:1. 对象缓存:细颗粒度,针对表的记录级别,透明化访问,在不改变程序代码的情况下可以极大提升web应用的性能。
对象缓存是ORM的制胜法宝。
2. 对象缓存的优劣取决于框架实现的水平,Hibernate 是目前已知对象缓存最强大的开源ORM3. 查询缓存:粗颗粒度,针对查询结果集,应用于数据实时化要求不高的场合十一、应用场合决定了系统架构一、是否需要ORMHibernate or iBATIS?二、采用ORM决定了数据库设计Hibernate:倾向于细颗粒度的设计,面向对象,将大表拆分为多个关联关系的小表,消除冗余column,通过二级缓存提升性能(DBA比较忌讳关联关系的出现,但是 ORM的缓存将突破关联关系的性能瓶颈);Hibernate的性能瓶颈不在于关联关系,而在于大表的操作iBATIS:倾向于粗颗粒度设计,面向关系,尽量把表合并,通过表column 冗余,消除关联关系。
无有效缓存手段。
iBATIS的性能瓶颈不在于大表操作,而在于关联关系。
总结:性能口诀1、使用双向一对多关联,不使用单向一对多2、灵活使用单向多对一关联3、不用一对一,用多对一取代4、配置对象缓存,不使用集合缓存5、一对多集合使用Bag,多对多集合使用Set6、继承类使用显式多态7、表字段要少,表关联不要怕多,有二级缓存撑腰hibernate与应用缓存方案总结关键字: hibernate与应用缓存方案总结XXXX项目是目前在实际工作中正在做的事情,该项目是一个大型系统的内容管理内核,负责最核心的meta data的集中管理,性能有较高的要求,设计初期就要求能够支持cluster。
项目使用hibernate 3.2,针对开发过程中对于各种缓存的不同看法,撰写了本文。
重点在于澄清一些hibernate的缓存细节,纠正一些错误的缓存用法。
一、hibernate的二级缓存如果开启了二级缓存,hibernate在执行任何一次查询的之后,都会把得到的结果集放到缓存中,缓存结构可以看作是一个hash table,key是数据库记录的id,value是id 对应的pojo对象。
当用户根据id查询对象的时候(load、iterator方法),会首先在缓存中查找,如果没有找到再发起数据库查询。
但是如果使用hql发起查询(find, query 方法)则不会利用二级缓存,而是直接从数据库获得数据,但是它会把得到的数据放到二级缓存备用。
也就是说,基于hql的查询,对二级缓存是只写不读的。
针对二级缓存的工作原理,采用iterator取代 list来提高二级缓存命中率的想法是不可行的。
Iterator的工作方式是根据检索条件从数据库中选取所有目标数据的id,然后用这些id一个一个的到二级缓存里面做检索,如果找到就直接加载,找不到就向数据库做查询。
因此假如iterator检索100条数据的话,最好情况是100%全部命中,最坏情况是0%命中,执行101条sql把所有数据选出来。
而list虽然不利用缓存,但是它只会发起1条sql取得所有数据。
在合理利用分页查询的情况下, list整体效率高于iterator。
二级缓存的失效机制由hibernate控制,当某条数据被修改之后,hibernate会根据它的id去做缓存失效操作。
基于此机制,如果数据表不是被hibernate独占(比如同时使用jdbc或者ado等),那么二级缓存无法得到有效控制。
由于hibernate的缓存接口很灵活,cache provider可以方便的切换,因此支持cluster 环境不是大问题,通过使用swarmcache、jboss cache等支持分布式的缓存方案,可以实现。
但是问题在于:1、分布式缓存本身成本偏高(比如使用同步复制模式的jboss cache)2、分布式环境通常对事务控制有较高要求,而目前的开源缓存方案对事务缓存(transaction cache)支持得不够好。
当jta事务发生会滚,缓存的最后更新结果很难预料。
这一点会带来很大的部署成本,甚至得不偿失。
结论:XXXX不应把hibernate二级缓存作为优化的主要手段,一般情况下建议不要使用。
原因如下:1、 XXXX 的DAO类大部分是从1.0升级过来,由于1.0采用的是hibernate 2.1,所以在批量删除数据的时候采用了native sql的方式。
虽然XXXX2.0已经完全升级到hibernate 3.2,支持hibernate原生的批量删改,但是由于hibernate批量操作的性能不如sql,而且为了兼容1.0的dao类,所以很多地方保留了sql操作。
哪些数据表是单纯被hibernate独占无法统计,而且随着将来业务的发展可能会有很大变数。
因此不宜采用二级缓存。
2、针对系统业务来说,基于id检索的二级缓存命中率极为有限,hql被大量采用,二级缓存对性能的提升很有限。
3、 hibernate 3.0在做批量修改、批量更新的时候,是不会同步更新二级缓存的,该问题在hibernate 3.2中是否仍然存在尚不确定。
二、hibernate的查询缓存查询缓存的实现机制与二级缓存基本一致,最大的差异在于放入缓存中的key是查询的语句,value是查询之后得到的结果集的id列表。
表面看来这样的方案似乎能解决hql 利用缓存的问题,但是需要注意的是,构成key的是:hql生成的sql、sql的参数、排序、分页信息等。
也就是说如果你的 hql有小小的差异,比如第一条hql取1-50条数据,第二条hql取20-60条数据,那么hibernate会认为这是两个完全不同的key,无法重复利用缓存。
因此利用率也不高。
另外一个需要注意的问题是,查询缓存和二级缓存是有关联关系的,他们不是完全独立的两套东西。
假如一个查询条件hql_1,第一次被执行的时候,它会从数据库取得数据,然后把查询条件作为 key,把返回数据的所有id列表作为value(请注意仅仅是id)放到查询缓存中,同时整个结果集放到class缓存(也就是二级缓存),key是 id,value 是pojo对象。