์ผ | ์ | ํ | ์ | ๋ชฉ | ๊ธ | ํ |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 | 31 |
- Absolute
- AGI
- ai
- AI agents
- AI engineer
- AI researcher
- ajax
- algorithm
- Algorithms
- aliases
- Array ๊ฐ์ฒด
- ASI
- bayes' theorem
- Bit
- Blur
- BOM
- bootstrap
- canva
- challenges
- ChatGPT
- Today
- In Total
A Joyful AI Research Journey๐ณ๐
[4] 241104 Text Analysis, Frequency Analysis [Goorm All-In-One Pass! AI Project Master - 4th Session, Day 4] ๋ณธ๋ฌธ
[4] 241104 Text Analysis, Frequency Analysis [Goorm All-In-One Pass! AI Project Master - 4th Session, Day 4]
yjyuwisely 2024. 11. 4. 09:22241104 Mon 4th class
์ค๋ ๋ฐฐ์ด ๊ฒ ์ค ๊ธฐ์ตํ ๊ฒ์ ์ ๋ฆฌํ๋ค.
ChatGPT: 10-20ํผ ๊ฐ์ง์ผ ๊ฒฝ์ฐ๊ฐ ์๋ค.
1๊ฐ๋ง ์ฌ์ฉX, ๊ฒ์๋ ํ์ฉํ๊ธฐ
ChatGPT: ์์ ์ง์์ ๊ฐ์ง๊ณ ์๋ ค์ค๋ค.
API Guide (GPTs)
1. ํ ์คํธ ์์ฑ ์ํ ์ฝ๋
from openai import OpenAI
# OpenAI API ํด๋ผ์ด์ธํธ ์ด๊ธฐํ
client = OpenAI(api_key="YOUR_API_KEY")
# ์ฑํ
๋ชจ๋ธ์ ์ฌ์ฉํ ํ
์คํธ ์์ฑ ์์ฒญ
response = client.chat.completions.create(
model="gpt-4o",
messages=[
{"role": "system", "content": "You are a helpful assistant."},
{"role": "user", "content": "Can you tell me about OpenAI's API?"}
]
)
# ์๋ต ์ถ๋ ฅ
print(response.choices[0].message.content)
2. ์ด๋ฏธ์ง ์์ฑ ์ํ ์ฝ๋
from openai import OpenAI
# OpenAI API ํด๋ผ์ด์ธํธ ์ด๊ธฐํ
client = OpenAI(api_key="YOUR_API_KEY")
# ์ด๋ฏธ์ง ์์ฑ ์์ฒญ
response = client.images.create(
model="gpt-4o-mini",
prompt="A futuristic cityscape with flying cars and neon lights",
size="1024x1024",
n=1 # ์์ฑํ ์ด๋ฏธ์ง ์
)
# ์ด๋ฏธ์ง URL ์ถ๋ ฅ
image_url = response.data[0].url
print(image_url)
3. ์๋ฌ ํธ๋ค๋ง ์์
from openai import OpenAI
import openai.error
client = OpenAI(api_key="YOUR_API_KEY")
try:
# ํ
์คํธ ์์ฑ ์์ฒญ
response = client.chat.completions.create(
model="gpt-4o",
messages=[
{"role": "system", "content": "You are a helpful assistant."},
{"role": "user", "content": "Explain OpenAI API usage."}
]
)
print(response.choices[0].message.content)
except openai.error.OpenAIError as e:
print("Error:", e)
gpt-4o ์ฌ์ฉ
๊ธฐํ chatGPT, ์ฝ๋ Claude
LLM ๋์ด ํฌ์
๋จ
์ด๋ฏธ์ง ํ์ฌ -> LLM
์ธ๋ ค๊ณ ํ๋ ๋ถ์ผ (์๋ฃ)
๋ ์ค๋ฅด๋ ๋ถ์ผ -> ์ทจ์
์ ๋์์ด ๋๋ค.
GAN, ์์ฑ AI -> ๋์ธ๊ฐ ๋จ
GAN(์์ฑ์ ์ ๋ ์ ๊ฒฝ๋ง)์ ๋ ๊ฐ์ ์ธ๊ณต์ ๊ฒฝ๋ง์ธ ์์ฑ์์ ํ๋ณ์๋ก ๊ตฌ์ฑ๋ ๋ฅ๋ฌ๋ ์ํคํ ์ฒ์ ๋๋ค. ์์ฑ์๋ ์ค์ ์ ์ ์ฌํ ๋ฐ์ดํฐ๋ฅผ ์์ฑํ๋ ์ญํ ์ ํ๋ฉฐ, ํ๋ณ์๋ ์์ฑ๋ ๋ฐ์ดํฐ๊ฐ ์ค์ ๋ฐ์ดํฐ์ธ์ง ์ฌ๋ถ๋ฅผ ํ๋ณํฉ๋๋ค. ์ด ๋ ์ ๊ฒฝ๋ง์ ์๋ก ๊ฒฝ์ํ๋ฉฐ ํจ๊ป ํ์ตํ๊ฒ ๋ฉ๋๋ค.
ํ๋ฆ ์บ์นํ๊ธฐ, ๋
ผ๋ฌธ ๋ฐ๋ผ๊ฐ๊ธฐ, ๋์ด ํ๋ฌ๊ฐ๋ ๊ณณ
์ ๋ช
ํ ์ฌ๋ -> ๋น ๋ฅด๊ฒ ์ ํด์ ์ ๋ณด ์ ๋ฌ
์ฐ๊ตฌ์: Figma ๊ฐ์
์ด๋ฏธ์ง ๋ถ์ผ
์ ๋ฌธ๊ฐ ์๊ฒฌ ๋ค์ด๋ณด๊ธฐ
๋ง๋ค๊ณ ๋ณด์ฌ์ฃผ๋ ๊ฑด ๋ค ํ๋ค.
์ฌ์ฉํด๋ณด๊ณ ๋ ์ฌํ, ํ๊ฐ ํ ๊ฒ์ฆ ์ค์
ํ ๋ฌ์ด ๋ถ์กฑํ ์๋ ์๋ค.
ํ๋ก์ ํธ ๋๋๊ณ ํ ๋ฌ ์ ๋ ๋ ๊ณต๋ถ -> ์ข์ ํ๋ก์ ํธ๊ฐ ๋์จ๋ค. ๊ฐ์น๊ฐ ์๋ค.
ํ๋๋ฅผ ํ๋๋ผ๋ ์ ๋๋ก ํ๋ ๊ฒ -> ๊ฐ์น ์ฌ๋ผ๊ฐ
ํ๋ก์ ํธ ๋๋๊ณ ํ ๋ฌ ํ ์ฐ๋ฝํด๋ ๋๋ค. ๋ด์ฃผ์ธ์ ๊ฐ๋ฅ
์์
์ค Kaggle, ๋ฐํํจ,
์์
์ธ์ ํผ์์ ํ ๋ฌ ๋ด๋ด ํจ, ๊ธฐ์
6-7๊ฐ ๋ถ์, ๊ณจ๋ผ์ ๊ฐ, ๊ทธ ๋ถ์ผ์ ๊น๊ฒ ๋ค์ด๊ฐ
๋ ๋ค๋ฅธ ๊ณผ์ ๋ฃ๊ธฐX (๊ฑฐ์ ์ด๊ธ, ์ค๊ธ์ด ๋ง๋ค.)
๋ง๋ ํ๋ก์ ํธ๋ค์ด ๋น์ท๋น์ทํ๋ค. ์๊ฐ 1-2๋
์ง๋๋ ํ๋ก์ ํธ ์์ค์ ๋น์ทํ๋ค.
์ค๋ ๋๊ธฐX
ํ๋ก์ ํธ ์ ๊ทธ๋ ์ด๋, ์ ๋ฆฌํ๊ธฐ
ํ์ ์๋ ๋ชปํ๋ ๊ฑธ ๋ง๋ค์ด๋ธ๋ค -> ์ทจ์
๋ง์ ๊ธํ ๊ฒX
๊ฐ์ฑ ๋ถ์, ์ข ๋ ๋ค์ด๊ฐ๋ ํ๋ก์ ํธ ๋ง๋ ๋ค. -> ๋์ ๊ฐ ์ ์๋ค.
์ค๋ฌด ์ ํ๋ ์ฌ๋์ ๋ค ์๋ค.
๊ณ์ ๋ฐ์ ํด๋๊ฐ์ผ ํ๋ค. ๊ณผ์ ์ฌ๋ฌ ๊ฐ ๋ค์ ํ์X (๋๊ฐ์ ๊ณผ์ ์ด๋ค.)
๋ชจ๋ฅด๋ ๋ฐ ๋ชจ๋ฅด๋ ๊ฑฐ ํ๋ฉด ํ ๋ฌ ๋์ ๊ฒฐ๊ณผX, ๋ฐฐ์ด ๊ฑดO, ์๋ชป๋ ๊ฑดX
๊น๊ฒ ๋ค์ด๊ฐ๋ค.
์๋ก์ด ๊ฑฐ -> ์คํจ ์ผ์ด์คO
Python ์ ํ๊ธฐ
๋ฐ์ดํฐ ๋ถ์: ์๊ฐํ ์ ํ๊ธฐ
๊ฐ์ ์ ์ด๋ฆฌ๋ ๋ถ์ผ, ์ง๊ธ๊น์ง ํด์๋ ๋ถ์ผ๋ก ์ง์ ํ๋ค.
์ด๋ณด์: ์ต์ 2์๊ฐ ๋ณต์ต
ํ์ธ ํ๋ ๋ชจ๋ธ ์, A/B ํ ์คํธ
A/B ํ ์คํธ๋ ๋ ๊ฐ์ง ์ด์์ ๋ฒ์ ์ ์๋น์ค๋ฅผ ๋น๊ตํ์ฌ ์ด๋ค ๊ฒ์ด ๋ ๋์ ์ฑ๊ณผ๋ฅผ ๋ด๋์ง๋ฅผ ํ๋จํ๋ ์คํ์ ๋๋ค. ์ด ๊ณผ์ ์์ ๊ฐ๊ธ์ ์ด๋ฉด ํ๋์ ๋ณ์๋ง ๋ณ๊ฒฝํ์ฌ ์ ์ง์ ์ผ๋ก ๊ฐ์ ์ ์ ์ฐพ๋ ๋ฐฉ์์ผ๋ก ์งํ๋ฉ๋๋ค. ์ฃผ๋ก ๋์งํธ ํ๊ฒฝ์์ ์ฌ์ฉ๋๋ฉฐ, ์ฌ์ฉ์๋ฅผ ๋์กฐ๊ตฐ๊ณผ ์คํ๊ตฐ์ผ๋ก ๋๋์ด ๋น๊ต ๋ถ์ํฉ๋๋ค.
VISION๊ณผ LLM ๋ชจ๋ ํฐ ์ ์ฌ๋ ฅ์ด ์์ง๋ง, ๊ฐ๊ฐ์ ์ฅ๋จ์ ๊ณผ ์ ๋ง์ ๋ถ์ํด๋ณด๊ฒ ์ต๋๋ค:
LLM์ ๊ฐ์ ๊ณผ ์ ๋ง:
- ๊ฑฐ์ ๋ชจ๋ ์ฐ์ ์์ ํ์ฉ ๊ฐ๋ฅ (๋ฌธ์์์ฑ, ์ฝ๋ฉ, ๊ณ ๊ฐ์๋น์ค ๋ฑ)
- ๊ธฐ์กด ๋น์ฆ๋์ค ํ๋ก์ธ์ค์ ์ฝ๊ฒ ํตํฉ ๊ฐ๋ฅ
- ๊ฒ์ฆ๋ ๋น์ฆ๋์ค ๋ชจ๋ธ ์กด์ฌ (ChatGPT, Claude ๋ฑ)
- ํ์ต ๋ฐ์ดํฐ ํ๋ณด๊ฐ ์๋์ ์ผ๋ก ์ฉ์ด
VISION์ ๊ฐ์ ๊ณผ ์ ๋ง:
- ์๋ฃ์์ ๋ถ์, ์์จ์ฃผํ, ๋ณด์/๊ฐ์ ๋ฑ ํนํ๋ ๋ถ์ผ์์ ๋์ ๊ฐ์น
- ์ค์๊ฐ ๋ฌผ์ฒด ์ธ์๊ณผ ์ฒ๋ฆฌ ๋ฅ๋ ฅ
- AR/VR๊ณผ ๊ฒฐํฉํ์ฌ ์๋ก์ด ์์ฉ ๋ถ์ผ ์ฐฝ์ถ ๊ฐ๋ฅ
- ์์ง ๊ฐ๋ฐ/๋ฐ์ ์ฌ์ง๊ฐ ๋ง์
ํ์ฌ ์ํฉ:
- LLM์ด ๋ ๊ด๋ฒ์ํ๊ฒ ํ์ฉ๋๊ณ ์์
- VISION์ ํน์ ๋ถ์ผ์์ ๋ ๊น์ ํ์ ์ ๊ฐ์ ธ์ฌ ์ ์์
- ๋ ๊ธฐ์ ์ ๊ฒฐํฉ(๋ฉํฐ๋ชจ๋ฌ AI)์ด ํฅํ ์ฃผ๋ชฉ๋ฐ์ ๊ฒ์ผ๋ก ์์
๊ฒฐ๋ก ์ ์ผ๋ก, ๋์ ๋น๊ตํ์ฌ "๋ ์ข๋ค"๊ณ ํ๊ธฐ๋ ์ด๋ ต๊ณ , ๊ฐ์์ ์์ญ์์ ์ค์ํ ๋ฐ์ ์ด ์์๋ฉ๋๋ค. ํนํ ๋ ๊ธฐ์ ์ ๊ฒฐํฉ์ด ๊ฐ์ ธ์ฌ ์๋์ง์ ์ฃผ๋ชฉํ ํ์๊ฐ ์์ต๋๋ค.
https://gamma.app/docs/-l42qil5qi2u7mh0
https://gamma.app/docs/-kq9s1nqizjdugrp?mode=doc
https://skaisummit.com/session
์ ํ ๋ฐ์ดํฐ๋ ๊ณ ์ ๋ ํ์์ ๊ฐ์ง๋ฉฐ, ์ฃผ๋ก ํ ํ์์ ๋ฐ์ดํฐ๋ก ์ซ์, ์งง์ ํ ์คํธ, ๋ ์ง์ ๊ฐ์ ์ด์ฐํ ๋ฐ์ดํฐ๊ฐ ํฌํจ๋ฉ๋๋ค. ๋ฐ๋ฉด ๋น์ ํ ๋ฐ์ดํฐ๋ ๋ช ํํ๊ฒ ์ ์๋ ๊ตฌ์กฐ๊ฐ ์๋ ๋ฐ์ดํฐ๋ก, ํ ์คํธ ๋ฌธ์, ์ด๋ฏธ์ง, ๋น๋์ค, ์ค๋์ค ํ์ผ ๋ฑ์ด ์ด์ ํด๋นํฉ๋๋ค. ๋น์ ํ ๋ฐ์ดํฐ๋ ์ ์ฒด ๋ฐ์ดํฐ์ ์๋น ๋ถ๋ถ์ ์ฐจ์งํ๊ณ ์์ผ๋ฉฐ, ๋ค์ํ ํํ๋ก ์กด์ฌํฉ๋๋ค.
- ์ ํ ๋ฐ์ดํฐ: ์ซ์, ํ, ํ ์ด๋ธ ํํ๋ก ๊ตฌ์กฐํ๋ ๋ฐ์ดํฐ๋ฅผ ๋งํฉ๋๋ค. ์๋ฅผ ๋ค์ด, ์์ ์ํธ์ ์ซ์ ๋ฐ์ดํฐ, ๋ฐ์ดํฐ๋ฒ ์ด์ค ํ ์ด๋ธ ๋ฑ์ ์ ํ ๋ฐ์ดํฐ์ ์์ ๋๋ค.
- ๋น์ ํ ๋ฐ์ดํฐ: ๊ตฌ์กฐํ๋์ง ์์ ๋ฐ์ดํฐ๋ก, ์์ฑ, ๊ทธ๋ฆผ, ๋์์, ํ ์คํธ(์: ์ด๋ฉ์ผ, ๋ฌธ์) ๋ฑ์ด ์ด์ ํด๋นํฉ๋๋ค. ์ด๋ฌํ ๋ฐ์ดํฐ๋ ์ผ์ ํ ํ์ ์์ด ๋ค์ํ ํํ๋ก ์กด์ฌํ๊ธฐ ๋๋ฌธ์ ๋น์ ํ ๋ฐ์ดํฐ๋ก ๋ถ๋ฅ๋ฉ๋๋ค.
์ ํ ๋ฐ์ดํฐ(Structured Data):
- ์ซ์, ๋ ์ง
- ๋ฐ์ดํฐ๋ฒ ์ด์ค์ ํ ์ด๋ธ ํํ
- ์์ ์คํ๋ ๋์ํธ
- ๋ช ํํ ๊ท์น๊ณผ ํ์์ด ์๋ ๋ฐ์ดํฐ
- ์: ๊ณ ๊ฐ์ ๋ณด(๋์ด, ์ฑ๋ณ, ์ฃผ์ ๋ฑ), ๊ฑฐ๋๋ด์ญ, ๊ธฐ์๋ฐ์ดํฐ
๋ฐ์ ํ ๋ฐ์ดํฐ(Semi-structured Data):
- HTML, XML, JSON
- ์ด๋ฉ์ผ
- ์ด๋ ์ ๋์ ๊ตฌ์กฐ๊ฐ ์์ง๋ง ์์ ํ ์ ํํ๋์ง ์์ ๋ฐ์ดํฐ
๋น์ ํ ๋ฐ์ดํฐ(Unstructured Data):
- ์ด๋ฏธ์ง, ์ฌ์ง
- ์์ฑ, ์์
- ํ ์คํธ ๋ฌธ์, SNS ๊ฒ์๊ธ
- ์ ํด์ง ํ์์ด๋ ๊ตฌ์กฐ๊ฐ ์๋ ์์ ๋ก์ด ํํ์ ๋ฐ์ดํฐ
- ์: CCTV ์์, ๊ณ ๊ฐ ๋ฆฌ๋ทฐ ํ ์คํธ, ์ ํ ํตํ ๋ น์
ํ
์คํธ ๋ง์ด๋: ์์ฐ์ด ์ฒ๋ฆฌ ๊ธฐ์ ์ ๊ธฐ๋ฐ, ๋ฌธ์ฅ ๋ถ์, ํ ํฐํ, ๊ฐ์ฒด๋ช
์ธ์
ํ
์คํธ ํํ ๋ฐฉ์: ๋จ์ด ๋น๋, TF-IDF, ์๋ ์๋ฒ ๋ฉ, ํ
์คํธ๋ฅผ ์์นํํ์ฌ ๋ถ์์ ํ์ฉ
๊ธฐ๊ณ ํ์ต ์๊ณ ๋ฆฌ์ฆ: ํ ์คํธ ๋ถ๋ฅ, ๊ตฐ์งํ, ํ ํฝ ๋ชจ๋ธ๋ง ๋ฑ์ ๊ธฐ๊ณ ํ์ต ๊ธฐ๋ฒ์ ํตํด ํ ์คํธ ๋ฐ์ดํฐ์์ ์๋ฏธ ์๋ ํจํด์ ๋ฐ๊ฒฌํ ์ ์์ต๋๋ค.
์๊ฐํ ๊ธฐ๋ฒ: ๋ถ์ ๊ฒฐ๊ณผ๋ฅผ ํจ๊ณผ์ ์ผ๋ก ํํํ๊ธฐ ์ํด ์๋ ํด๋ผ์ฐ๋, ํํธ๋งต, ํธ๋ ๋ ๊ทธ๋ํ ๋ฑ์ ์๊ฐํ ๊ธฐ๋ฒ์ ํ์ฉํฉ๋๋ค.
K-means ์๊ณ ๋ฆฌ์ฆ์ ๋น์ง๋ ํ์ต์ ์ผ์ข ์ผ๋ก, ๋ฐ์ดํฐ๋ฅผ ๋ฏธ๋ฆฌ ์ ํด์ง K๊ฐ์ ํด๋ฌ์คํฐ๋ก ๋ฌถ๋ ํด๋ฌ์คํฐ๋ง ์๊ณ ๋ฆฌ์ฆ์ ๋๋ค. ์ด ์๊ณ ๋ฆฌ์ฆ์ ๊ฐ ํด๋ฌ์คํฐ ๋ด ๋ฐ์ดํฐ ํฌ์ธํธ์ ํด๋ฌ์คํฐ ์ผํฐ ๊ฐ์ ๊ฑฐ๋ฆฌ๋ฅผ ์ต์ํํ๋ ๋ฐฉ์์ผ๋ก ์์ ํ๋ฉฐ, ํด๋ฌ์คํฐ์ ํ๊ท ์ ๋ฐ๋ณต์ ์ผ๋ก ์ ๋ฐ์ดํธํ์ฌ ๊ฐ์ฅ ๊ฐ๊น์ด ์ ๋ค์ ๊ตฐ์งํํฉ๋๋ค.
ex) ๋ฏธ๋ ํ๋ก์ ํธ: ์๋ ๊ฒ, ๋ด์ค ๊ธฐ์ฌ ๋ถ์