<html><body><div style="color:#000; background-color:#fff; font-family:Courier New, courier, monaco, monospace, sans-serif;font-size:12pt"><div id="yiv4387437050"><div><div style="color:#000;background-color:#fff;font-family:Courier New, courier, monaco, monospace, sans-serif;font-size:12pt;"><div id="yiv4387437050yui_3_7_2_37_1375801766760_39">Hi Guys,</div><div id="yiv4387437050yui_3_7_2_37_1375801766760_61"><br></div><div style="color:rgb(0, 0, 0);font-size:16px;font-family:Courier New, courier, monaco, monospace, sans-serif;background-color:transparent;font-style:normal;" id="yiv4387437050yui_3_7_2_37_1375801766760_63">We're running slony 2.1.3, and one of my slaves has failed.&nbsp; The issue is that the failed slave node is a provider to another downstream slave; am I right in thinking I have to drop both the failed node and the downstream subscriber slave?</div><div id="yiv4387437050yui_3_7_2_37_1375801766760_113" style="color:rgb(0, 0,
 0);font-size:16px;font-family:Courier New, courier, monaco, monospace, sans-serif;background-color:transparent;font-style:normal;"><br id="yiv4387437050yui_3_7_2_37_1375801766760_118"></div><div id="yiv4387437050yui_3_7_2_37_1375801766760_115" style="color:rgb(0, 0, 0);font-size:16px;font-family:Courier New, courier, monaco, monospace, sans-serif;background-color:transparent;font-style:normal;">My setup basically looks like this, where subscriber2 has failed:<br></div><div id="yiv4387437050yui_3_7_2_37_1375801766760_123" style="color:rgb(0, 0, 0);font-size:16px;font-family:Courier New, courier, monaco, monospace, sans-serif;background-color:transparent;font-style:normal;"><br id="yiv4387437050yui_3_7_2_37_1375801766760_128"></div><div id="yiv4387437050yui_3_7_2_37_1375801766760_125" style="color:rgb(0, 0, 0);font-size:16px;font-family:Courier New, courier, monaco, monospace, sans-serif;background-color:transparent;font-style:normal;">origin ---&gt;
 subscriber1<br></div><div id="yiv4387437050yui_3_7_2_37_1375801766760_153" style="color:rgb(0, 0, 0);font-size:16px;font-family:Courier New, courier, monaco, monospace, sans-serif;
background-color:transparent;font-style:normal;">&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; ---&gt; subscriber2 ---&gt; subscriber3<br></div><div id="yiv4387437050yui_3_7_2_37_1375801766760_159" style="color:rgb(0, 0, 0);font-size:16px;font-family:Courier New, courier, monaco, monospace, sans-serif;background-color:transparent;font-style:normal;">&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; <br id="yiv4387437050yui_3_7_2_37_1375801766760_183"></div><div id="yiv4387437050yui_3_7_2_37_1375801766760_180" style="color:rgb(0, 0, 0);font-size:16px;font-family:Courier New, courier, monaco, monospace, sans-serif;background-color:transparent;font-style:normal;"><br>First I tried to reshape the subscription on subscriber3, but this didn't work:<br><br><span style="font-weight: bold;">SUBSCRIBE SET ( ID=@my_set, PROVIDER = @origin, RECEIVER = @subscriber3, FORWARD = YES);</span><br><br>This failed with the following message:<br><br>glyn@x:/usr/share/slonik$ slonik
 reshape_provider.scr<br>reshape_provider.scr:3: could not connect to server: Connection refused<br>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Is the server running on host "10.16.10.101" and accepting<br>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; TCP/IP connections on port 5432?<br><br>Where 10.16.10.101 is the IP of subscriber2. So I tried to just drop the node:<br><br><span style="font-weight: bold;"><span class="tab">DROP NODE ( ID = @subscriber2, EVENT NODE = @origin );</span></span><br><br>And the following happened:<br><br>glyn@x:/usr/share/slonik$ slonik drop_node.scr<br>drop_node.scr:3: could not connect to server: Connection refused<br>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Is the server running on host "10.16.10.101" and accepting<br>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; TCP/IP connections on port 5432?<br>waiting for events&nbsp; (7,5014269532) only at (7,5014260307) to be confirmed on node 5<br>waiting for events&nbsp;
 (7,5014269532) only at (7,5014260307) to be confirmed on node 5<br>waiting for events&nbsp; (7,5014269532) only at (7,5014260307) to be confirmed on node 5<br>waiting for events&nbsp; (7,5014269532) only at (7,5014260307) to be confirmed on node 5<br>waiting for events&nbsp; (7,5014269532) only at (7,5014260307) to be confirmed on node 5<br></div><div id="yiv4387437050yui_3_7_2_37_1375801766760_194" style="color:rgb(0, 0, 0);font-size:16px;font-family:Courier New, courier, monaco, monospace, sans-serif;background-color:transparent;font-style:normal;"><br>Where "node 5" is subscriber3.<br><br>So now slonik is waiting on subscriber3 to come in sync, but it's just trying to sync from subscriber2 which has gone.&nbsp; Heres the log from subscriber3:<br><br>2013-08-06_163034 BSTERROR&nbsp; slon_connectdb: PQconnectdb("dbname=SEE host=10.16.10.101 user=slony") failed - could not connect to server: Connection
 refused<br>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Is the server running on host "10.16.10.101" and accepting<br>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; TCP/IP connections on port 5432?<br>2013-08-06_163034 BSTWARN&nbsp;&nbsp; remoteListenThread_4: DB connection failed - sleep 10 seconds<br>2013-08-06_163034 BSTDEBUG2 remoteWorkerThread_7: SYNC 5014260308 processing<br>2013-08-06_163034 BSTERROR&nbsp; slon_connectdb: PQconnectdb("dbname=SEE host=10.16.10.101 user=slony") failed - could not connect to server: Connection refused<br>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; Is the server running on host "10.16.10.101" and accepting<br>&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; TCP/IP connections on port 5432?<br>2013-08-06_163034 BSTERROR&nbsp; remoteWorkerThread_7: cannot connect to data provider 4 on 'dbname=SEE host=10.16.10.101 user=slony'<br>2013-08-06_163034 BSTDEBUG2 remoteListenThread_7: queue event 7,5014270211 SYNC<br>2013-08-06_163034
 BSTDEBUG2 remoteWorkerThread_8: forward confirm 7,5014270210 received by 8<br>2013-08-06_163036 BSTDEBUG2 syncThread: new sl_action_seq 1 - SYNC 5005139878<br>2013-08-06_163036 BSTDEBUG2 remoteListenThread_7: queue event 7,5014270212 SYNC<br>2013-08-06_163036 BSTDEBUG2 remoteListenThread_8: queue event 8,5013135166 SYNC<br>2013-08-06_163036 BSTDEBUG2 remoteWorkerThread_8: Received event #8 from 5013135166 type:SYNC<br>2013-08-06_163036 BSTDEBUG1 calc sync size - last time: 1 last length: 10069 ideal: 5 proposed size: 3<br>2013-08-06_163036 BSTDEBUG2 remoteWorkerThread_8: SYNC 5013135166 processing<br>2013-08-06_163036 BSTDEBUG1 remoteWorkerThread_8: no sets need syncing for this event<br>2013-08-06_163036 BSTDEBUG2 remoteWorkerThread_8: forward confirm 7,5014270211 received by 8<br>2013-08-06_163042 BSTDEBUG2 localListenThread: Received event 5,5005139878 SYNC<br>2013-08-06_163042 BSTDEBUG2 remoteListenThread_7: queue event 7,5014270213
 SYNC<br>2013-08-06_163042 BSTDEBUG2 remoteListenThread_7: queue event 7,5014270214 SYNC<br>2013-08-06_163042 BSTDEBUG2 remoteListenThread_7: queue event 7,5014270215 SYNC<br>2013-08-06_163042 BSTDEBUG2 remoteWorkerThread_8: forward confirm 5,5005139878 received by 8<br>2013-08-06_163042 BSTDEBUG2 remoteWorkerThread_8: forward confirm 7,5014270214 received by 8<br id="yiv4387437050yui_3_7_2_37_1375801766760_199"></div><div id="yiv4387437050yui_3_7_2_37_1375801766760_196" style="
color:rgb(0, 0, 0);font-size:16px;font-family:Courier New, courier, monaco, monospace, sans-serif;background-color:transparent;font-style:normal;"><br><br>So what do I do?&nbsp; I presume I'll be waiting forever, so do I kill slonik and drop subscriber3 too?<br></div></div></div></div></div></body></html>