Greetings all,<br><br>I have a master-slave setup and am trying to automate a recovery situation where the master fails and it is recreated from scratch based on a dump from the slave&#39;s database.<br><br>Here&#39;s the flow of events I am using to test the transition:<br>
<br>1. the cluster is registered, the master and slave are in sync, all good.<br>2. the master dies. the master database is recreated from scratch using a dump from the slave&#39;s database<br>3. the master-slave replication cluster is deleted using the following code snippet:<br>
<br>cluster name = my_cluster;<br>node 1 admin conninfo = &#39;dbname=replica_test_master host=localhost user=postgres&#39;;<br>node 2 admin conninfo = &#39;dbname=replica_test_slave host=localhost user=postgres&#39;;<br>
uninstall node ( id = 1 );<br>uninstall node ( id = 2 );<br><br>4. the slony cluster is recreated from scratch using the exact same commands used in step 1<br>5. data is inserted into the master database, but IT IS NOT populated into the slave. The last lines found on the slony process running against the slave are the following:<br>
<br>2010-04-16 11:39:42 AST CONFIG version for &quot;dbname=replica_test_slave user=postgres&quot; is 80401<br>2010-04-16 11:39:42 AST CONFIG remoteWorkerThread_1: update provider configuration<br>2010-04-16 11:39:42 AST CONFIG version for &quot;dbname=replica_test_master host=localhost user=postgres&quot; is 80401<br>
TODO: ********** remoteWorkerThread: node 1 - EVENT 1,27 STORE_NODE - unknown event type<br>2010-04-16 11:39:42 AST CONFIG storeListen: li_origin=1 li_receiver=2 li_provider=1<br>TODO: ********** remoteWorkerThread: node 1 - EVENT 1,28 ENABLE_NODE - unknown event type<br>
2010-04-16 11:39:42 AST CONFIG storeListen: li_origin=1 li_receiver=2 li_provider=1<br>2010-04-16 11:39:42 AST CONFIG storeListen: li_origin=1 li_receiver=2 li_provider=1<br>2010-04-16 11:39:42 AST CONFIG remoteWorkerThread_1: update provider configuration<br>
<br>These log events are the same when the cluster is working flawlessly (although more events are logged after these, of course).<br>It looks as thought the replication silently stops working with no apparent reason.<br>
Could anyone please help me understand what might be going wrong? <br><br>Thanks<br> Albert<br><br>