<div dir="ltr">Hello, <div><br></div><div>I am still on this issue. Today, I disable the loadbalancing to a specific varnish server whose ban list was around 500K (n_object is around 600K)</div><div><br></div><div>After 4 hours without any requests other than "BAN", the ban list is still increasing, and I got a system load around 1.5. </div><div><br></div><div>A "top" with thread show that the ban_lurker is eating 100% of 1 CPU (8 cpu computer)</div><div><br></div><div><div>top - 14:47:53 up 91 days, 22:36,  2 users,  load average: 1.57, 1.45, 1.49</div><div>Threads: 702 total,   2 running, 700 sleeping,   0 stopped,   0 zombie</div><div>%Cpu(s): 11.6 us,  0.2 sy,  0.0 ni, 88.1 id,  0.0 wa,  0.0 hi,  0.1 si,  0.0 st</div><div>KiB Mem:   8196832 total,  5532436 used,  2664396 free,    98028 buffers</div><div>KiB Swap:   499708 total,        0 used,   499708 free.  1077884 cached Mem</div><div><br></div><div>  PID USER      PR  NI    VIRT    RES    SHR S %CPU %MEM     TIME+ COMMAND                                                                                                                                                                                   </div><div> 4606 vcache    20   0 4212992 3.553g  85300 R 99.9 45.5   6991:50 ban-lurker                                                                                                                                                                                </div><div>                                                                                                                                                                              </div></div><div>Is is possible that the ban_lurker is locked or in an infinite loop (I know it is single threaded) ? What kind of dump can I provide to help understand this issue ? </div><div><br></div><div>Regards</div><div><br></div><div>Olivier</div></div><div class="gmail_extra"><br><div class="gmail_quote">2017-09-04 16:54 GMT+02:00 Olivier Hanesse <span dir="ltr"><<a href="mailto:olivier.hanesse@gmail.com" target="_blank">olivier.hanesse@gmail.com</a>></span>:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><div dir="ltr">In this case, that means that as long as the ban lurker is working, no statistics are updated right ?<div><br><div>So if I don't see any updates of statistics such as "bans_deleted", or "bans_lurker_obj_killed_<wbr>cutoff" during a long period, it doesn't mean that the lurker is sleeping, hanged or waiting for a lock, it  means that the lurker worker is working pretty "hard", is that correct ?</div><div><div><br></div></div></div></div><div class="HOEnZb"><div class="h5"><div class="gmail_extra"><br><div class="gmail_quote">2017-09-04 16:11 GMT+02:00 Dridi Boukelmoune <span dir="ltr"><<a href="mailto:dridi@varni.sh" target="_blank">dridi@varni.sh</a>></span>:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><span>On Mon, Sep 4, 2017 at 2:12 PM, Olivier Hanesse<br>
<<a href="mailto:olivier.hanesse@gmail.com" target="_blank">olivier.hanesse@gmail.com</a>> wrote:<br>
> Are the stats used by varnishstat about the lurker "well" updated "every minute" ? The fact that the statistics was only updated once is kinda strange : the ban list size is higher than the cutoff value everyday :(<br>
<br>
</span>No, that's a limitation of the statistics, serving HTTP traffic has<br>
higher priority than committing updates of the counters.<br>
<br>
See this for reference:<br>
<br>
<a href="https://github.com/varnishcache/varnish-cache/pull/2290" rel="noreferrer" target="_blank">https://github.com/varnishcach<wbr>e/varnish-cache/pull/2290</a><br>
<span class="m_1387003695867087534HOEnZb"><font color="#888888"><br>
Dridi<br>
</font></span></blockquote></div><br></div>
</div></div></blockquote></div><br></div>