Spring quartz定时Job 引起的死锁问题


错误提示如下:

 org.springframework.dao.CannotAcquireLockException: could not update: [com.ibm.org.reimbursement.pojo.TRmbsClaim#675006]; nested exception is org.hibernate.exception.LockAcquisitionException: could not update: [com.ibm.org.reimbursement.pojo.TRmbsClaim#675006]
  at org.springframework.orm.hibernate3.SessionFactoryUtils.convertHibernateAccessException(SessionFactoryUtils.java:633)
  at org.springframework.orm.hibernate3.HibernateAccessor.convertHibernateAccessException(HibernateAccessor.java:412)
  at org.springframework.orm.hibernate3.HibernateTemplate.doExecute(HibernateTemplate.java:424)
  at org.springframework.orm.hibernate3.HibernateTemplate.executeWithNativeSession(HibernateTemplate.java:374)
  at org.springframework.orm.hibernate3.HibernateTemplate.find(HibernateTemplate.java:921)
  at org.springframework.orm.hibernate3.HibernateTemplate.find(HibernateTemplate.java:913)
  at com.ibm.process.persistence.CommonDAO.retriveByFilter(CommonDAO.java:117)
  at com.cmcc.eip.service.hr.ValidateImportPayPaymentInfoService.run(ValidateImportPayPaymentInfoService.java:147)
  at sun.reflect.GeneratedMethodAccessor199.invoke(Unknown Source)
  at sun.reflect.DelegatingMethodAccessorImpl.invoke(DelegatingMethodAccessorImpl.java:25)
  at java.lang.reflect.Method.invoke(Method.java:585)
  at org.springframework.aop.support.AopUtils.invokeJoinpointUsingReflection(AopUtils.java:307)
  at org.springframework.aop.framework.ReflectiveMethodInvocation.invokeJoinpoint(ReflectiveMethodInvocation.java:182)
  at org.springframework.aop.framework.ReflectiveMethodInvocation.proceed(ReflectiveMethodInvocation.java:149)
  at org.springframework.transaction.interceptor.TransactionInterceptor.invoke(TransactionInterceptor.java:106)
  at org.springframework.aop.framework.ReflectiveMethodInvocation.proceed(ReflectiveMethodInvocation.java:171)
  at org.springframework.aop.framework.JdkDynamicAopProxy.invoke(JdkDynamicAopProxy.java:204)
  at $Proxy91.run(Unknown Source)
  at sun.reflect.GeneratedMethodAccessor198.invoke(Unknown Source)
  at sun.reflect.DelegatingMethodAccessorImpl.invoke(DelegatingMethodAccessorImpl.java:25)
  at java.lang.reflect.Method.invoke(Method.java:585)
  at org.springframework.util.MethodInvoker.invoke(MethodInvoker.java:276)
  at org.springframework.scheduling.quartz.MethodInvokingJobDetailFactoryBean$MethodInvokingJob.executeInternal(MethodInvokingJobDetailFactoryBean.java:260)

  at org.springframework.scheduling.quartz.QuartzJobBean.execute(QuartzJobBean.java:86)
  at org.quartz.core.JobRunShell.run(JobRunShell.java:203)
  at org.quartz.simpl.SimpleThreadPool$WorkerThread.run(SimpleThreadPool.java:520)
  Caused by: org.hibernate.exception.LockAcquisitionException: could not update: [com.ibm.org.reimbursement.pojo.TRmbsClaim#675006]
  at org.hibernate.exception.SQLStateConverter.convert(SQLStateConverter.java:82)
  at org.hibernate.exception.JDBCExceptionHelper.convert(JDBCExceptionHelper.java:43)
  at org.hibernate.persister.entity.AbstractEntityPersister.update(AbstractEntityPersister.java:2222)
  at org.hibernate.persister.entity.AbstractEntityPersister.updateOrInsert(AbstractEntityPersister.java:2118)
  at org.hibernate.persister.entity.AbstractEntityPersister.update(AbstractEntityPersister.java:2374)
  at org.hibernate.action.EntityUpdateAction.execute(EntityUpdateAction.java:91)
  at org.hibernate.engine.ActionQueue.execute(ActionQueue.java:248)
  at org.hibernate.engine.ActionQueue.executeActions(ActionQueue.java:232)
  at org.hibernate.engine.ActionQueue.executeActions(ActionQueue.java:140)
  at org.hibernate.event.def.AbstractFlushingEventListener.performExecutions(AbstractFlushingEventListener.java:297)
  at org.hibernate.event.def.DefaultAutoFlushEventListener.onAutoFlush(DefaultAutoFlushEventListener.java:41)
  at org.hibernate.impl.SessionImpl.autoFlushIfRequired(SessionImpl.java:954)
  at org.hibernate.impl.SessionImpl.list(SessionImpl.java:1099)
  at org.hibernate.impl.QueryImpl.list(QueryImpl.java:79)
  at org.springframework.orm.hibernate3.HibernateTemplate$30.doInHibernate(HibernateTemplate.java:930)
  at org.springframework.orm.hibernate3.HibernateTemplate.doExecute(HibernateTemplate.java:419)

  ... 23 more
  Caused by: com.ibm.db2.jcc.b.pm: The current transaction has been rolled back because of a deadlock or timeout.  Reason code "68".. SQLCODE=-911, SQLSTATE=40001, DRIVER=3.50.152
  at com.ibm.db2.jcc.b.wc.a(wc.java:568)
  at com.ibm.db2.jcc.b.wc.a(wc.java:57)
  at com.ibm.db2.jcc.b.wc.a(wc.java:126)
  at com.ibm.db2.jcc.b.tk.c(tk.java:1901)
  at com.ibm.db2.jcc.t4.db.s(db.java:877)
  at com.ibm.db2.jcc.t4.db.k(db.java:388)
  at com.ibm.db2.jcc.t4.db.a(db.java:59)
  at com.ibm.db2.jcc.t4.t.a(t.java:50)
  at com.ibm.db2.jcc.t4.tb.b(tb.java:200)
  at com.ibm.db2.jcc.b.uk.Gb(uk.java:2355)
  at com.ibm.db2.jcc.b.uk.e(uk.java:3129)
  at com.ibm.db2.jcc.b.uk.zb(uk.java:568)
  at com.ibm.db2.jcc.b.uk.executeUpdate(uk.java:551)
  at com.ibm.ws.rsadapter.jdbc.WSJdbcPreparedStatement.pmiExecuteUpdate(WSJdbcPreparedStatement.java:1081)
  at com.ibm.ws.rsadapter.jdbc.WSJdbcPreparedStatement.executeUpdate(WSJdbcPreparedStatement.java:748)
  at org.hibernate.jdbc.NonBatchingBatcher.addToBatch(NonBatchingBatcher.java:23)
  at org.hibernate.persister.entity.AbstractEntityPersister.update(AbstractEntityPersister.java:2204)
  ... 36 more

db2 编码

筷子不可食用 12 years, 3 months ago

Quartz 实际并不关心你是在相同的还是不同的机器上运行节点。当集群是放置在不同的机器上时,通常称之为水平集群。节点是跑在同一台机器是,称之为垂直集群。对于垂直集群,存在着单点故障的问题。这对高可用性的应用来说是个坏消息,因为一旦机器崩溃了,所有的节点也就被有效的终止了。

当你运行水平集群时,时钟应当要同步,以免出现离奇且不可预知的行为。假如时钟没能够同步,Scheduler 实例将对其他节点的状态产生混乱。有几种简单的方法来保证时钟何持同步,而且也没有理由不这么做。最简单的同步计算机时钟的方式是使用某一个 Internet 时间服务器(Internet Time Server ITS)。

没什么会阻止你在相同环境中使用集群的和非集群的 Quartz 应用。唯一要注意的是这两个环境不要混用在相同的数据库表。意思是非集群环境不要使用与集群应用相同的一套数据库表;否则将得到希奇古怪的结果,集群和非集群的 Job 都会遇到问题。

假如你让一个非集群的 Quartz 应用与集群节点并行着运行,设法使用 JobInitializationPlugin和 RAMJobStore。

一包辣条233 answered 10 years, 5 months ago

一般死锁不可能在发生了5分钟后才发现,除非你的数据库死锁监控间隔参数调整了,通常这个参数是不会被修改的。这样的事情我估计是由于你的所等待造成的(你的锁定超时时间上限为300)。当然是你的程序逻辑有问题才导致这个现象发生,那么怎么找到是哪一个程序持有了锁而不释放呢?

  1. 重新执行你的应用
  2. db2 list application show detail,使用此命令可以看到lock-wait状态的应用程序
  3. db2 get snapshot for application agentid <>,把处于lock-wait状态的应用程序id放在见括号位置,使用这个命令可以看到该程序等待的应用程序id,继续使用命令3进行跟踪即可
Maycry answered 10 years, 5 months ago

我们经常碰到,你查一下代码中可有大事务存在,比如删除全表这样的操作。一般自己不显式开启事务的话,是不会出现死锁的,只有可能是处理超时。

你是真皮虾发 answered 10 years, 5 months ago

Your Answer