일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | ||||
4 | 5 | 6 | 7 | 8 | 9 | 10 |
11 | 12 | 13 | 14 | 15 | 16 | 17 |
18 | 19 | 20 | 21 | 22 | 23 | 24 |
25 | 26 | 27 | 28 | 29 | 30 | 31 |
- 신청
- 3과목
- 데이터분석프로젝트
- dsa프로젝트
- 정기시험
- 기술통계
- 자격증
- 분위수
- 티스토리챌린지
- 인스타툰 #지식 #클래스101 #전자책 #인스타그램 #인스타 #만화 #웹툰 #아이패드드로잉
- 데이터독학
- 방학
- WISET
- 옻
- 평균
- 연속확률분포
- 이항분포
- 대학생
- 머신러닝
- 파이썬
- ADSP
- 데이터분석
- 베르누이
- 오블완
- R
- r #데이터분석 #adsp #자격증 #대외활동 #여름방학 #취업준비
- 3ㅣ
- 독학
- 기하분포
- 절사평균
- Today
- Total
mmings_pring_day
[e- 비즈니스] 5+1 주) 빅데이터 and AI 본문
1. Google DeepMind
[알파고]
-> 의미
- 바둑의 규칙을 하나하나 직접 입력하여 개발된 '전문가 시스템' 이 아니라 머신러닝 기술을 사용하여 스스로 바둑에서 이기는 법을 파악
- 범용성을 갖고 있기 때문에 다른 분야 (기후 모델링, 의료진단 등)에 활용
[알파고 Zero]
- 의미
= 기보 없이 스스로 대결하면서 '강화학습'
= 기존의 데이터를 학습하여 패턴을 찾고 예측 -> 스스로 데이터와 결과를 생산하면서 학습
= 학습할 데이터가 충분히 없는 경우의 AI
= 초반에 기보 학습 방법이 일정 수준에 도달한 후에는 알파고에게 오히려 방해가 되었음
- 적은 자원 및 시간
= 한 대의 컴퓨터/ 4개의 TPU
= 학습을 시작한 3일 만에 '알파고 리'에 승리, 학습 21일 째에는 '알파고 마스터'에 승리
- 알고리즘
= 가치망과 정책망을 통합한 신경망 (연산속도와 효율성이 높음)
2. Overview of AI
- 인공지능의 정의 = 기계에 의해 입증된 지능
- 지능의 정의
(1) 정보를 인식하거나 추론하는 능력 (perceive or infer)
(2) 그리고 지식으로 유지하기 위해
(3) 환경 또는 맥락 내에서 적응 행동에 적용하기
-> 기업이 적절하게 작동할 수 있는 품질 과 환경에 대한 선견지명
=> '문제 해결을 위해' 무언가를 이해하고, 배우는 능력
- 행동은 '결과'를 도출하기 위해서 조건 (환경)을 이해하고 불확실성을 줄이려는 노력으로 구성됨
(예- 운전자는 주의 환경을 즉각적으로 인지하고 사고의 위험을 줄이기 위해서 조정함. 즉, 예측과 함께 판단을 하는 것)
- AI) 환경을 인식하고 -> 목표를 성공적으로 달성할 수 있는 기회를 최대화할 조치를 취하는 모든 장치
3. AI 와 빅데이터
[AI와 빅데이터의 상호보완 효과]
- AI) 분석력, 예측력
- 빅데이터) 신뢰성, 현실성
- 방대한 양의 데이터가 AI 의 실현 가능성 및 연구의 신뢰성을 높여주고 있는 것
* 방대한 양의 데이터 습득과 학습, 분석, 추론 등을 통해 알고리즘의 정확성 및 정교성을 높일 수 있음
- 빅데이터 분야 역시 AI 의 분석력, 추론력, 예측력 등을 활용하면 더욱 지능화된 가치있는 서비스 창출이 가능
=> AI 와 빅데이터는 상호보완적인 역할을 수행하면서, 서로에게 시너지효과를 만들어 낼 수 있음
- 생성형 AI 시대, 결국엔 '똘똘한 데이터'가 경쟁력을 가른다.
(생성형 AI 시대에서 경쟁 우위를 점하기 위해선 '양질의 AI 학습용 데이터를 확보'하는 것이 중요하다고 입을 모음.
'생성형 AI 성능을 획기적으로 개선하기 위해 주목해야 할 점은 "단순히 많은 양의 데이터를 컴퓨터에 학습시키는 것이 아님" + "고품질의 AI 데이터를 가지고 학습시키는 것이 더욱 중요함')
- AI 훈련에 '뉴스 기사 무단 사용') 미국 신문사들, MS, 오픈 AI 에 소송
[라이선스체결 미디어사]
- Open AI 뉴스코프 산하 10개사 (WSJ, 뉴욕포스트, 하퍼콜린스, 더타임즈 등)
=> 5년 간 2억 5천만 달러: 컨텐츠 라이선스 협약 체결
- Open AI 와의 협약의 구성) AI 훈련에 사용, 챗봇 답변에 활용, 현금성 크레딧
[위법인가 공정한 사용인가?]
- 저작권이 있는 컨텐츠를 제 3자가 변형적 목적으로 사용할 경우, 공정한 사용으로 간주되어 왔음
- 뉴욕타임즈는 무단 복제로 독자감소와 회사 이익 감소로 저작권 침해를 주장
[AI 업체의 대응방안]
- Synthetic Datasets
- 자기학습과 데이터 생성을 반복하면? AI 로 생성한 데이터로 학습한 AI 성능이 급격하게 떨어지고 결국엔 붕괴함
-> 인간이 생성한 결과물 (데이터)을 계속 필요로 함
4. 자율자동차
[구글 웨이모 로보택시]
- 주간 유료 승차 10만 건 돌파
(1년 3개월 만에 2배/ 고속도로 주행 시범운행 시작)
- 센서 (4개 라이다, 6개 레이다, 14개 카메라, 8개 초음파 센서 등)
- 3D 지도 데이터 (데이터 수집 차량 + 웨이모 택시로부터 입력된 정보로 업데이트)
- 운행 관제
= 실시간 센서 입력 데이터 + 3D 지도 맵핑
= 실시간 엔진, 핸들, 브레이크, 엑셀 등 모든 장치의 동작정보 서버로 전송
= '중앙 관제센터'에서는 웨이모 택시의 움직임과 동작 상황을 원격에서 사람이 관리
5. AI 빅데이터 활용 산업 사례
1) 헬스케어
[루닛]
- 영상의학 및 병리학 분야에서의 집단과 치료를 혁신
- AI 기반 의료 소프트웨어 개발 회사
= X-ray, 컴퓨터 단층촬영(CT), 병리학적 슬라이드 이미지 등을 분석
= 흉부 X-ray 에서 폐결절이나 폐렴, 결핵, 폐암 등의 이상 징후를 자동으로 탐지
= 암조직의 슬라이드 이미지를 분석하여 종양의 특성과 치료반응을 예측
- 비즈니스 모델
= 소프트웨어 라이센싱 (구독모델)
= 의료기기 제조사와 협력하여 의료기기에 소프트웨어 통합 (GE Healthcare, 필립스)
= R&D :개발 및 임상시험을 통한 유효성 입증으로 각국의 규제기관의 승인
- 성과
= 40여 개국에서 자사의 AI 솔루션을 제공
= 루닛 인사이트 여러 국가의 규제 기관으로부터 의료기기 인증 획득
[뷰노]
- 의료 진단과 치료를 지원하는 AI 기반 소프트웨어를 개발
= 흉부 엑스레이 영상분석 > 폐 질환을 자동으로 진단 (폐암, 폐결핵, 폐렴)
= 뼈 엑스레이 영상분석 > 골연령을 평가 (소아 내분비학에서 활용)
- BM
= 루닛과 유사
= 클라우드 기반의 솔루션 제공으로 중소병원에서 낮은 비용으로 사용 가능
* 신약개발 분야에서도 AI가 활발히 활용되고 있음
[환자 기록작성]
- AWS 헬스 스크라이브
= 생성형 AI + 음성인식 )환자의 진료기록을 자동으로 작성
- MS 닥터 익스프레스
= GPT-4 활용 (환자 당 7분의 시간 절약)
- 구글 메드팜 (미국의 메요클리닉 등 의료기관에서 도입)
6. AI 발전방향
[AI Agents]
= 인간 비서처럼 방대한 작업을 수행할 수 있는 시스템
(예- AI Agents 와 여행 예약하기)
- 호텔과 비행기 티켓 내 일정과 선호에 맞게
- 여행 지역, 목적, 날씨 예측에 맞게 짐에 넣어야 하는 물건 체크리스트
- 변경, 요청, 불만사항을 나를 대신하여 적절한 상대에게 처리하는 등
- 설명 가능한 AI/ 연합 AI
1. 챗GPT 역사
- 역사
[RNN]
- 텍스트는 문자, 단어의 순차 데이터
- 순차데이터 처리를 위해 개발된 NN (Neural Network)
- 이미 나왔던 단어를 기억하지 못함
[LSTM: Long Short-Term Memory]
- RNN 인데, 입력 시퀀스에 과거 데이터를 넣어서 Long-term Memory 를 구현함
- 수백 개 길이의 단어를 다룰 수 있게 됨
- 순서 의존성을 이해하는 LSTM 의 능력은 음성 인식과 기계 번역 등 복잡한 문제를 해결하는 데 결정적 역할 수행
[Transformer]
- 자연어 텍스트 등의 시퀀스를 처리하는 NN
- 시퀀스에서 각 단어나 구가 나타나는 위치를 추적할 수 있는 NN
-> 문장 속에서 단어 사이의 상호작용을 이해해 문맥을 파악
- 단계별로 시퀀스를 처리했던 이전 모델과는 다르게 모든 부분을 동시에 처리
[GPT: Generative Pretrained Transformer, Open AI]
- LLM = Transformer 와 엄청난 양의 텍스트를 학습 (비지도)시킨 NN 를 결합함
- N 개의 단어 배열이 주어지면 N+1 번째 나올 '가장 그럴듯한 단어를 출력'
-> 이러한 방식으로, 반복과 대답, 과 문장을 생성하는 단순한 구조
[GPT-3]
- 새로운 모형을 만든 것이 아니고 기존모형을 초확대함 (매개변수, 많은 텍스트를 학습시킴)
- 질문에 답, 문서 요약, 다양한 문체로 스토리 생성, 여러 언어 간의 번역 등을 함
- 인터넷에 떠도는 문서들이 학습에 사용되어 misinformation, prejudice 문제 발생
[ChatGPT]
- GPT 3를 대화에 적합하도록 학습시켜 모든 사람이 사용할 수 있도록 한 서비스
- GPT 엔진을 타 기업이 활용하여 고유 서비스를 최종 고객에 제공하는 생태계 구축
2. LLM 이슈
- 문제점
(1) 정확성 = 환각/ 미반영 문제
(2) 안정성= 공격이나 유도에 대한 보호, 모니터링과 필터링 필요
(3) 거버넌스 = Compliances/ Privacy
- 경량화 모델 (LLM 경량화)
= 2년 만에 1/ 240 (모델의 크기를 줄여서 가격을 낮춤)
= 성능을 올리는 것의 한계에 다다름
- Open vs Closed
[Closed Source]
- 대부분 large scale LLM 모델
- 코드와 데이터는 비공개이며, 상업적인 사용을 위해 제한적으로 제공 (예- Open Ai, BARD_Google)
- 장점
= 높은 품질과 성능보장/ 안정성과 지원
= 수익화 모델 (Open AI 는 ChatGPT Plus 유료 구독 서비스 및 API 사용을 통해 수익 창출)
= 데이터 보호 및 통제 (데이터 유출이나 지적 재산권 문제에 대한 우려가 적음)
- 단점
= 커스터마이징의 한계/ 비용과 의존성
[Open Source]
- 대부분 Small LLM 모델, Non-commercial (예- Llama, Hugging Face_오픈 소스 SLM의 호스팅 플랫폼 역할)
- 장점
= 자유로운 접근 및 커스터마이징이 가능하여 빠른 구현이 가능
= 투명성: 모델 구조와 학습 과정이 공개되어 연구자와 개발자의 모델 이해와 개선이 증진됨
= 생태계의 확장성: 다양한 분야의 기여가 모여 강력한 협업 네트워크를 형성
= 비용절감: 연구기관과 벤처기업에게 도움이 됨
- 단점
= 지원의 한계: 기술적 문제는 커뮤니티 내에서 자체적으로 해결해야 함
= 책임 문제: 모델에 대한 책임과 안정성을 보장하지 않음
-
-
-
'2024-2학기 > e-비즈니스' 카테고리의 다른 글
[e- 비즈니스] 시험 공부 (0) | 2024.10.20 |
---|---|
[e- 비즈니스] e- 비즈니스의 개념과 모델 (0) | 2024.10.18 |
[e- 비즈니스] 2. 인터넷 (0) | 2024.10.12 |
[e- 비즈니스] 4. 빅데이터 (0) | 2024.10.05 |
[e-비즈니스] 1. 정보화 (0) | 2024.09.27 |