서론

  • 얼마전에 AMD 라이젠 데스크톱을 구매 함
  • 웹서버/블로그를 라이젠 데스크톱으로 이전 함
  • 힙하고 쿨한 Docker로 이전 함
    • Wordpress
    • GitLab
    • Nginx
    • jekyll
    • etc..
  • 근데 서버가 접속이 안됨

증상

  • 외부에서 SSH 접속이 안됨
  • 데스크톱 화면이 안나오거나 멈춰있음
  • 적게는 2시간, 길게는 5일마다 불규칙적 발생
  • 특정 행동에 제한없이 발생 함
  • 키보드/마우스 입력이 먹지 않음
  • OS 로그가 남지 않음
  • 원인 불명

의심

  • 네트워크 공격에 의한 부하
    • 랜선 빼도 같은 증상
  • 해킹 또는 좀비PC
    • 아 이건 좀..
  • AMD 라이젠 장애
    • 확인 불가
    • 최신 커널 업데이트 해도 동일 증상
  • 그래픽카드 호환 장애
    • 확인 불가
    • 최신 드라이버 설치 해도 동일 증상
  • 지포스 드라이버 또는 커널 장애
    • 커널패닉 또는 메세지 없음

과정

  • AMD 또는 지포스 드라이버로 잠정 결론
  • 갓 AWS로 이전 계획
  • docker로 편하게 이전
  • AWS 이전 후 2~3일 후 같은 증상
    • AWS 헬스체크 장애
    • ssh 연결 응답없음. 재부팅 안됨
    • 강제 인스턴스 종료 후
  • docker 컨테이너 모두 내리고 2~3일 가동 테스트 통과
  • docker 컨테이너를 하나씩 올리면서 테스트
    • Gitlab 컨테이너에서 문제 확인

결론

  • Docker에서 Gitlab을 쓴게 문제가 있음
  • 상세 원인 불명
  • 의증
    1. Gitlab 저장소를 이전(복구) 과정에서 여하한 문제 발생
    2. 이전 후 버전 업데이트를 과정에서 여하한 문제 발생
    3. Docker Gitlab자체 문제 (설마..)
  • Gitlab은 안쓰는중..