프로젝트

일반

사용자정보

Actions

Task #332

완료됨

마일스톤 #83: 서비스 운영 모니터링

인프라 센서 데이터 수신 모니터링(6/24~6/30)

현호 강이(가) 일년 이상 전에 추가함. 일년 이상 전에 수정됨.

상태:
백업
담당자:
시작일:
2024/06/24
완료기한:
2024/06/30
진척도:

100%


설명

목적

  • 현장 설치/운영 중인 인프라 센서 상태 모니터링

목표

  • 이슈 확인을 통한 빠른 현장 대응을 통해 센서 데이터 수집의 지속성 유지

기간

  • 상시

참여인력

  • 강현호
Actions #1

현호 강이(가) 일년 이상 전에 변경

24.06.24 08:38 현재 제천 3개소, 대전 7개소, 안양 1개소 데이터 수신 이상 무!

Actions #2

현호 강이(가) 일년 이상 전에 변경

  • 완료기한을(를) 2024/06/30(으)로 지정되었습니다.
Actions #3

현호 강이(가) 일년 이상 전에 변경

24.06.24 14:28 카이스트 화암생활관 센서 데이터 이상 메일 확인

24.06.24 14:30 카이스트 화암생활관 센서 데이터 정상 메일 확인

데이터 확인 결과,
24.06.24 14:12:44 마지막 데이터 확인

24.06.24 14:31:45 데이터 재 수신 확인됨.

24.06.24 14:40 현재 데이터 수신 정상

Actions #4

현호 강이(가) 일년 이상 전에 변경

24.06.24 18:09 현재 제천 3개소, 대전 7개소, 안양 1개소 데이터 수신 이상 무!

Actions #5

현호 강이(가) 일년 이상 전에 변경

24.06.25 08:47 현재 제천 3개소, 대전 7개소, 안양 1개소 데이터 수신 이상 무!

Actions #6

현호 강이(가) 일년 이상 전에 변경

24.06.25 17:46 현재 제천 3개소, 대전 7개소, 안양 1개소 데이터 수신 이상 무!

Actions #7

현호 강이(가) 일년 이상 전에 변경

24.06.26 16:47 현재 제천 3개소, 대전 7개소, 안양 1개소 데이터 수신 이상 무!

Actions #8

현호 강이(가) 일년 이상 전에 변경

24.06.27 08:12 현재 제천 3개소, 대전 7개소, 안양 1개소 데이터 수신 이상 무!

Actions #9

현호 강이(가) 일년 이상 전에 변경

24.06.27 17:44 현재 제천 3개소, 대전 7개소, 안양 1개소 데이터 수신 이상 무!

Actions #10

현호 강이(가) 일년 이상 전에 변경

24.06.28 07:55 현재 제천 3개소, 대전 7개소, 안양 1개소 데이터 수신 이상 무!

Actions #11

현호 강이(가) 일년 이상 전에 변경

24.06.28 03:10 카이스트 화암생활관 센서 데이터 이상 메일 확인

24.06.28 03:12 카이스트 화암생활관 센서 데이터 정상 메일 확인

데이터 확인 결과,
24.06.28 02:55:14 마지막 데이터 확인

24.06.28 03:14:16 데이터 재 수신 확인됨.

24.06.28 07:55 현재 데이터 수신 정상

Actions #12

현호 강이(가) 일년 이상 전에 변경

24.06.29 02:59 카이스트 화암생활관 센서 데이터 이상 메일 확인

24.06.29 03:02 카이스트 화암생활관 센서 데이터 정상 메일 확인

데이터 확인 결과,
24.06.29 02:44:35 마지막 데이터 확인

24.06.29 03:03:34 데이터 재 수신 확인됨.

24.06.29 10:10 현재 데이터 수신 정상

Actions #13

현호 강이(가) 일년 이상 전에 변경

24.06.29 10:10 현재 제천 3개소, 대전 7개소, 안양 1개소 데이터 수신 이상 무!

Actions #14

현호 강이(가) 일년 이상 전에 변경

안양 석수 사이트 센서 이슈 확인되어 공유드립니다.
6/30 오전 1시 센서 비정상 알람 메일
6/30 오전 8시 40분경 알람 메일 확인 및 중은,지호 수석님께 상황 공유

  • 센서 데이터 미수신, 게이트웨이 로그 수신
    지호 수석님께서 원격 접속 확인, 재부팅 하여 정상 작동 확인.
Actions #15

현호 강이(가) 일년 이상 전에 변경

이슈 정리 (송지호 수석)

  1. 현상
  • 24.06.30 00:50 쯤 부터 센서와의 연결 끊김
  • 센서를 재연결 하는 프로세스가 실행되었으나, 정상 접속이 안되는 상황 (access denied)
  • 24.06.30 12:30 쯤 원격으로 RPI를 재부팅하기 전까지 위의 상황 지속
  1. 원인 분석
  • 리눅스의 usb device 연결 상태를 확인해 보았을 때, /dev/ttyUSB0 장치가 존재
  • 하지만, 해당 장치를 이용하여 센서(STM32)와의 통신이 불가능한 상황
  • 해당 장치는 PoE 일 뿐, PoE와 센서(STM32)와의 연결은 정상 작동이 안될수 있음
  1. 해결 방안
  • RPI의 재부팅을 시도
  • 이후 정상 작동 확인
  1. 향후 대책
  • RPI를 원격 재부팅하지 않고, PoE를 재부팅하는 방법?
  • STM32에서 연결이 끊긴 이유 확인 및 대응 방안 마련

(* 문제가 생길 경우, 왜 RPI를 자동으로 재부팅하지 않게 하는지?
혹시나 무한 재부팅 이슈에 걸릴 경우 RPI에 부하가 걸려 정상 부팅이 안되는 현상이 있음)

Actions #16

현호 강이(가) 일년 이상 전에 변경

  • 진척도을(를) 0에서 100(으)로 변경되었습니다.
Actions

내보내기 Atom PDF