Day6 (11.1, 월)
오늘의 한 일
1. Prediction Hard Voting
import os
import json
from collections import Counter
def ensemble_with_hardvoting(file_directory, output_file):
"""
hard voting with prediction files
Arguments:
file_directory(str):
str 로 이루어진 prediction 파일들이 있는 폴더 경로
output_filename(str):
str 로 이루어진 output 파일 경로+이름
Return:
None
"""
file_list = os.listdir(file_directory)
json_dataset_list = []
for file in file_list:
with open(os.path.join(path, file)) as json_data:
json_dataset_list.append(json.load(json_data))
ensembled_data = dict()
for index in range(0, len(json_dataset_list[0].items())):
temp_list = []
for json_data in json_dataset_list:
temp_list.append(list(json_data.values())[index])
temp_counter = Counter(temp_list)
ensembled_data[list(json_data.keys())[index]] = temp_counter.most_common()[0][0]
with open(output_file, 'w', encoding='UTF-8') as fp:
json.dump(ensembled_data, fp, indent=4, ensure_ascii=False)2. Probability Soft Voting
[방법1]
3. validation set 사용하기
4. NER로 Augmentation 하기

Last updated