본문 바로가기

카테고리 없음

Python Pandas 챗GPT를 활용하는 방법

* 아래에 활용된 데이터는 임의로 생성한 데이터이며, 실제 사용자 정보가 아닙니다.

 

[1] 기본적으로 아래와 같이 dataframe이 있다고 가정하자, 여기서는 event_df 라는 변수 할당시켜놨다

 

 

[2] 아래의 코드를 실행해서 챗GPT 넣어줄 사전정보를 출력한다.  ➡️ 출력된 값을 복사한다.

df = onoff_df
# dataframe을 넣으세요

df_name = 'onoff_df'
# dataframe의 변수명을 입력하세요

#-- 토큰수 한계(3.5기준) 에 맞춰 프롬프트 생성 --#
import numpy as np

def count_tokens(text):
    # 공백을 기준으로 문자열을 나눠서 토큰으로 만듭니다.
    tokens = text.split()
    return len(tokens)

past_count_prompt = 0
for idx in range(1000):
    prompt = f"해당 데이터에 대해 분석할건데 기억에 저장해주고, 절대 아무것도 출력하지마 : {df_name} = pd.DataFrame('{str(df.head(idx).to_dict())}')"
    count_prompt = count_tokens(prompt)
    if count_prompt == past_count_prompt:
        break
    if count_prompt > 3000:
        break
    past_count_prompt = count_prompt
print(prompt)

.

 

[3] 챗GPT에게 위에서 출력값을 그대로 실행해서 데이터를 기억할 수 있게 만든다

 

[3] 아래에 프롬프트를 활용해서 챗GPT에게 문의한다. ➡️ 결과를 복사한다

* 이미지는 '예시'이며, 아래 블럭의 프롬프트가 내용 최신 업데이트된 사항입니다! (달라도 상관없음, 블럭 내용 사용)

# input and output: onoff_df 
# 위에 dataframe을 참고한 명령 : 0,1,2,3 index의 row들을 지워줘
# 파이썬 함수를 만들어줘
# 반드시 실행했을때 바로 결과가 나오도록 만들어줘, 예시 dataframe을 생성하지마
# input으로 들어간 변수로 다시 재할당 시켜줘

.

 

 

[4] 챗GPT에서 알려준걸 복사해서 jupyter notebook 에서 실행

 

[5] 만약 에러가 난다면? ➡️ 실행한 코드와 에러난 결과를 모두 복사 ➡️ 챗GPT에게 넣어준다 ➡️ 수정된 코드로 실행해본다!

 

 

 

 


(개정판 업데이트 연구중)

df = onoff_df
# dataframe을 넣으세요

df_name = 'onoff_df'
# dataframe의 변수명을 입력하세요

ask = "신청행사 column의 값들을 datetime으로 만들어줘"

#-- 토큰수 한계(3.5기준) 에 맞춰 프롬프트 생성 --#
import numpy as np

def count_tokens(text):
    # 공백을 기준으로 문자열을 나눠서 토큰으로 만듭니다.
    tokens = text.split()
    return len(tokens)

past_count_prompt = 0
for idx in range(1000):
    prompt = f"해당 데이터에서 {ask} : {df_name} = pd.DataFrame('{str(df.head(idx).to_dict())}')"
    count_prompt = count_tokens(prompt)
    if count_prompt == past_count_prompt:
        break
    if count_prompt > 1000:
        break
    past_count_prompt = count_prompt
print(prompt)