* 아래에 활용된 데이터는 임의로 생성한 데이터이며, 실제 사용자 정보가 아닙니다.
[1] 기본적으로 아래와 같이 dataframe이 있다고 가정하자, 여기서는 event_df 라는 변수 할당시켜놨다

[2] 아래의 코드를 실행해서 챗GPT 넣어줄 사전정보를 출력한다. ➡️ 출력된 값을 복사한다.
df = onoff_df
# dataframe을 넣으세요
df_name = 'onoff_df'
# dataframe의 변수명을 입력하세요
#-- 토큰수 한계(3.5기준) 에 맞춰 프롬프트 생성 --#
import numpy as np
def count_tokens(text):
# 공백을 기준으로 문자열을 나눠서 토큰으로 만듭니다.
tokens = text.split()
return len(tokens)
past_count_prompt = 0
for idx in range(1000):
prompt = f"해당 데이터에 대해 분석할건데 기억에 저장해주고, 절대 아무것도 출력하지마 : {df_name} = pd.DataFrame('{str(df.head(idx).to_dict())}')"
count_prompt = count_tokens(prompt)
if count_prompt == past_count_prompt:
break
if count_prompt > 3000:
break
past_count_prompt = count_prompt
print(prompt)
.

[3] 챗GPT에게 위에서 출력값을 그대로 실행해서 데이터를 기억할 수 있게 만든다

[3] 아래에 프롬프트를 활용해서 챗GPT에게 문의한다. ➡️ 결과를 복사한다
* 이미지는 '예시'이며, 아래 블럭의 프롬프트가 내용 최신 업데이트된 사항입니다! (달라도 상관없음, 블럭 내용 사용)
# input and output: onoff_df
# 위에 dataframe을 참고한 명령 : 0,1,2,3 index의 row들을 지워줘
# 파이썬 함수를 만들어줘
# 반드시 실행했을때 바로 결과가 나오도록 만들어줘, 예시 dataframe을 생성하지마
# input으로 들어간 변수로 다시 재할당 시켜줘
.

[4] 챗GPT에서 알려준걸 복사해서 jupyter notebook 에서 실행

[5] 만약 에러가 난다면? ➡️ 실행한 코드와 에러난 결과를 모두 복사 ➡️ 챗GPT에게 넣어준다 ➡️ 수정된 코드로 실행해본다!

(개정판 업데이트 연구중)
df = onoff_df
# dataframe을 넣으세요
df_name = 'onoff_df'
# dataframe의 변수명을 입력하세요
ask = "신청행사 column의 값들을 datetime으로 만들어줘"
#-- 토큰수 한계(3.5기준) 에 맞춰 프롬프트 생성 --#
import numpy as np
def count_tokens(text):
# 공백을 기준으로 문자열을 나눠서 토큰으로 만듭니다.
tokens = text.split()
return len(tokens)
past_count_prompt = 0
for idx in range(1000):
prompt = f"해당 데이터에서 {ask} : {df_name} = pd.DataFrame('{str(df.head(idx).to_dict())}')"
count_prompt = count_tokens(prompt)
if count_prompt == past_count_prompt:
break
if count_prompt > 1000:
break
past_count_prompt = count_prompt
print(prompt)