본문 바로가기

전체 글11

머신러닝 시스템 설계 - 8장 데이터 분포 시프트와 모니터링 요약 머신러닝 시스템 설계 8장 데이터 분포 시프트와 모니터링을 요약한 내용입니다. 머신러닝 시스템 설계 : 네이버 도서 네이버 도서 상세정보를 제공합니다. search.shopping.naver.com 8.1 머신러닝 시스템 장애 원인 장애는 시스템에 대한 기대치가 한가지 이상 어긋날 때 일어납니다. 전통적인 소프트웨어에서는 주로 시스템 운영에 대한 기대치, 즉 시스템 로직이 레이턴시와 스루풋 같은 운영 지표의 기대 범위 안에서 실행되는지가 중요합니다. ML 시스템에서는 운영 지표와 ML 성능 지표 모두 신경 써야 합니다. 운영상 기대치를 어기는 문제는 감지하기가 보다 쉽습니다. 반면에 ML 성능상 기대치를 어기는 문제는 프로덕션 환경에서 ML 모델 성능을 측정하고 모니터링해야 하므로 감지하기가 보다 어렵습.. 2023. 8. 23.
머신러닝 시스템 설계 - 5장 피처 엔지니어링 요약 머신러닝 시스템 설계 5장 피처 엔지니어링을 요약한 내용입니다. 머신러닝 시스템 설계 : 네이버 도서 네이버 도서 상세정보를 제공합니다. search.shopping.naver.com 1. 학습된 피처 vs 엔지니어링된 피처 딥러닝의 장점은 피처를 수작업으로 만들 필요가 없습니다. 이러한 이유로 딥러닝을 피처학습이라고도 합니다. 많은 피처들이 알고리즘에 의해 자동으로 학습되고 추출됩니다. 다만 모든 피처가 자동화하려면 아직 멀었습니다. 그 이유로 프로덕션용 ML 애플리케이션의 대부분이 딥러닝이 아니라는 점입니다. 피처 엔지니어링에는 도메인별 기술에 대한 지식이 필요합니다. 피처 엔지니어링 프로세스는 반복적인 경향이 있으며, 따라서 취약할 수 있습니다. 딥러닝이 부상하면서 이러한 어려움이 상당 부분 해소됐.. 2023. 8. 9.
2장 - 머신러닝 시스템 설계 소개 2.1 비즈니스와 머신러닝의 목적 ML 프로젝트에서 데이터 과학자들은 ML 모델 성능을 측정하는 지표를 ML의 목적으로 보고 큰 관심을 기울이곤 한다. 데이터 과학자들은 비즈니스 지표는 고려하지 않고 ML 지표에 매달리는 경향이 있다. 그러나 기업들이 관심을 가지는 지표는 주주의 이익 극대화, 직간접적 이윤 증가 등 비즈니스 지표로 서로 일치하지 않아 프로젝트가 조기에 중단되기도 한다. 비즈니스 조직 내에서 ML 프로젝트가 성공하려면 ML 시스템 성과와 비즈니스 성과를 연결해야 한다. EX) 광고 클릭율 예측, 이상 거래 탐지와 같은 예시가 ML 모델 성능과 비즈니스 지표와 연결하기 쉬워 인기있는 ML의 가장 인기 있는 유스 케이스 이다. 많은 회사들이 비즈니스 지표를 ML 지표에 연결하기 위해 자체 지.. 2023. 7. 18.