엔드포인트 노드 동기화 관련 문의드립니다

안녕하세요,

엔드포인트 노드 연결시에 다음과 같은 메세지가 나오면서, 한참 기다려야 동기화가 시작되는 것을 볼 수 있었습니다.
INFO[11/18,16:35:23 +09] [34] Removed the node without any response Discover=Simple StorageName=PN NodeID=ff3f708eb8753df1 NodeType=PN
INFO[11/18,16:35:28 +09] [33] [Dial] Add dial candidate from static nodes id=a4c8aabb0e92be60 NodeType=2 ip=13.209.17.46 mainPort=32323 port=[32323]
INFO[11/18,16:35:32 +09] [33] [Dial] Add dial candidate from static nodes id=e9b23984e894540e NodeType=2 ip=54.180.180.197 mainPort=32323 port=[32323]
INFO[11/18,16:35:58 +09] [33] [Dial] Removing expired dial candidate from static nodes id=a4c8aabb0e92be60 addr=13.209.17.46:32323 dialType=PN dialCount=2 err=“is expired”
INFO[11/18,16:35:58 +09] [33] [Dial] Add dial candidate from static nodes id=81c44374fe0ff0ab NodeType=2 ip=13.209.215.234 mainPort=32323 port=[32323]
INFO[11/18,16:36:02 +09] [33] [Dial] Removing expired dial candidate from static nodes id=e9b23984e894540e addr=54.180.180.197:32323 dialType=PN dialCount=2 err=“is expired”
INFO[11/18,16:36:02 +09] [33] [Dial] Add dial candidate from static nodes id=4283bb4ce1820093 NodeType=2 ip=52.78.131.49 mainPort=32323 port=[32323]
INFO[11/18,16:36:28 +09] [33] [Dial] Add dial candidate from static nodes id=81c44374fe0ff0ab NodeType=2 ip=13.209.215.234 mainPort=32323 port=[32323]

혹시, 위의 메세지가 몇몇 static node들이 p2p연결이 되지 않는 상태에 있는 것이라면, 해당 노드들을 제외하고 탐색할 수 있는 방법이 있는지 알려주시면 감사하겠습니다.

도익화 지연이 다른 이유라면 그 원인을 알려주시면 감사하겠습니다.

안녕하세요, 먼저 궁금한데 싱크가 잘 되던 노드가 갑자기 안되는 건가요?
만약 노드를 처음 운영하시는 거라면 방화벽 및 네트워크 상태를 한번 확인해봐야 할 것 같습니다.
그리고 ken.conf와 static-node.json을 공유해주실 수 있나요?

안녕하세요, 싱크가 잘 되던 노드였습니다.
연결을 끊었다가 다시 연결할 때 가끔씩 지연 되다가 싱크가 진행되는 것 같습니다.

kend.conf는 기본 파일을 그대로 이용하고 있으며, static-node.json 파일은 어느 위치에 있는지 알려주시면 확인해 보겠습니다.

오늘은 다음과 같은 static node들에서 싱크가 되지 않는 것을 확인하였습니다.

NodeType=2 ip=43.200.183.31 mainPort=32323 port=[32323]
INFO[11/21,00:31:16 +09] [33] [Dial] Removing expired dial candidate from static nodes id=a4c8aabb0e92be60 addr=13.209.17.46:32323 dialType=PN dialCount=2 err=“is expired”
INFO[11/21,00:31:16 +09] [33] [Dial] Removing expired dial candidate from static nodes id=1328937357576856 addr=43.200.183.31:32323 dialType=PN dialCount=1 err=“is expired”
INFO[11/21,00:31:16 +09] [33] [Dial] Add dial candidate from static nodes id=a4c8aabb0e92be60 NodeType=2 ip=13.209.17.46 mainPort=32323 port=[32323]
INFO[11/21,00:31:16 +09] [33] [Dial] Add dial candidate from static nodes id=01bca1d259a0aae6 NodeType=2 ip=3.38.140.52 mainPort=32323 port=[32323]
INFO[11/21,00:31:46 +09] [33] [Dial] Add dial candidate from static nodes id=a4c8aabb0e92be60 NodeType=2 ip=13.209.17.46 mainPort=32323 port=[32323]
INFO[11/21,00:31:46 +09] [33] [Dial] Add dial candidate from static nodes id=01bca1d259a0aae6 NodeType=2 ip=3.38.140.52 mainPort=32323 port=[32323]
INFO[11/21,00:31:58 +09] [34] Removed the node without any response Discover=Simple StorageName=PN NodeID=a0404af62fcc442f NodeType=PN
INFO[11/21,00:32:16 +09] [33] [Dial] Add dial candidate from static nodes id=a4c8aabb0e92be60 NodeType=2 ip=13.209.17.46 mainPort=32323 port=[32323]
INFO[11/21,00:32:16 +09] [33] [Dial] Add dial candidate from static nodes id=01bca1d259a0aae6 NodeType=2 ip=3.38.140.52 mainPort=32323 port=[32323]
INFO[11/21,00:32:37 +09] [34] Removed the node without any response Discover=Simple StorageName=PN NodeID=94cc15e2014b8658 NodeType=BN
INFO[11/21,00:32:46 +09] [33] [Dial] Add dial candidate from static nodes id=01bca1d259a0aae6 NodeType=2 ip=3.38.140.52 mainPort=32323 port=[32323]
INFO[11/21,00:32:46 +09] [33] [Dial] Add dial candidate from static nodes id=a4c8aabb0e92be60 NodeType=2 ip=13.209.17.46 mainPort=32323 port=[32323]

static-node.json은 kend.conf에 설정하신 [datadir]/klay/static-node.json에 있습니다.

따로 설정하지 않으셨다면 해당 파일을 사용하고 계시지 않을거같긴한데요 안정성이 높은 pn으로 설정하신다면 원활하게 싱크가 진행될거 같습니다.

그렇지만 근본적인 해결책은 아닌듯 보입니다. 연결할 Peer가 불안정하다면 지연되는건 자연스러운 현상이긴한데요 지연되는 시간이 얼마나 되는지 대략적으로 아실까요?

안정적인 peer를 찾을 때 까지 걸리는 시간이 지난번이랑 달랐던 것 같습니다. 지난번에는 40분 정도 후에 block number가 따라가기 시작하였고, 이번에는 20분 정도 걸린 것 같습니다.

그리고, 위 로그에서 보았는데 expired 되었다고 제거된 static node(13.209.17.46)가 다시 candidate로 들어와서 지속적으로 연결을 시도하는 것을 보았습니다.

해당 부분은 최근 다이얼 실패이력을 관리하도록 하면 개선될 수 있을거 같아 보입니다.

우선 dial실패원인은 디버그 수준의 로그로 출력되도록 되어있는데, 한번 kend.conf에 verbosity를 2또는 3으로 한번 실행해보신후 결과공유 부탁드립니다.