News最新消息

首頁>最新消息>【與AI語音對話 複賽比賽規則及檔案細項說明】
【與AI語音對話 複賽比賽規則及檔案細項說明】2018-12-07 00:00:00.0回索引頁

【與AI語音對話 複賽比賽規則及檔案細項說明】

晉級複賽的各位團隊
賽前賽即將在明日下午13:00開始
相關資訊已上傳至 gitlab,見「README.md」檔案
祝大家順利!!

1. API 測試時程表已更新於 gitlab的semi-finals-2018專案之 2-2-2 API測試時程表V2.docx,還請團隊前往gitlab確認。
註:新增兩場測試時間、SSH連線權限關閉時間和測試題目改和比賽題數相同。

2. 新增「2-2-3 API-Flow.pptx」 於 gitlab的semi-finals-2018專案,該檔案簡單講解API運作流程,另外之後會在整理一份團隊可能問答,還請耐心等候。

# Kaggle 4000題比賽事項
1. 比賽時間:將於2018/12/08 (UTC+08:00)台北時間 下午01:00 PM~04:00 PM開啟,共計3小時。
2. 繳交限制:每個參賽隊伍最多只能上傳5次,比賽結束前可以選擇1筆上傳結果做為評分依據。
3. 參賽規則:參賽隊伍僅能使用一個帳號,註冊多個Kaggle帳號來取得更多上傳次數是違背競賽規則,團隊分數將不列入採計。
4. 參賽名稱:參賽隊伍於Kaggle上顯示的名稱和官網報名的名稱一致,之後都會依此名稱公布名單,如有不同還請提前寄信告知。
5. 其餘規則:未有特別說明者,一律根據官網上的說明及註冊參賽時規章為主。
6. Kaggle開放時間:將於2018/12/08 (UTC+08:00)台北時間 中午12:00 AM開啟,嚴禁於比賽時間開始前進行上傳,違者分數將不列入採計。
7. Kaggle上所進行的4000題不需要用到官方雲端主機,只有現場賽才需要使用官方雲端主機進行比賽。

# 聲音檔案
1. 取樣格式:單聲道(Mono),16kHz,16 bits PCM 。
2. 音檔格式:*.wav 。
3. 音檔數量:一組包含[文章*1、題目*1、選項*1],共4000組 。
4. 檔案命名: 
* 文章代號為A:A0000001.wav,範例 A0000001.wav
* 題目代號為B:B0000001.wav,範例 B0000001.wav
* 選項代號為C:C0000001.wav,範例 C0000001.wav
5. 比賽音檔:請至Gitlab內的專案semi-finals-2018下載文章音檔(不壓縮),問題和選項音檔會預先加密壓縮
*公布密碼時,Gitlab將會同步上傳解壓縮的音檔(B、C)以及未加密的壓縮檔(B.zip、C.zip)。
6. 壓縮密碼:將於2018/12/08 (UTC+08:00)台北時間 中午12:00 AM 於Gitlab、官網、FB公布壓縮檔密碼。
7. 上傳格式:採用csv檔上傳,逗號分割。
* 欄位ID為題目編號(檔名去掉英文、數字前面補的0和副檔名.wav),不連續編號
* 欄位Answer為答案請填數字1到4

# 語料庫(必做)
1. 檔案1:單純語音辨認器辨認出的逐字稿文字跟對應的記錄檔,尤其是字或詞的信心值分數。
2. 檔案2:經後級NLP或是其他方式校正過的逐字稿的文字結果跟對應的記錄檔,尤其是字或詞的信心值分數。
3. 檔案3:每題四個答案的分數。
4. 檔案4:說明檔,解釋上傳的檔案1~3的內容與格式。
5. 檔案5:系統描述,說明系統架構與做法。
6. 上傳方式:於Gitlab建立名稱為semi-finals-2018的專案,並將5個檔案上傳。
7. 截止日期:台北時間(UTC+08:00) 12/10 23:59分截止。 
8. 繳交方式:至Gitlab建立一個專案,名稱請命名為semi-finals-2018,並將這次比賽所產生的紀錄檔上傳至您自己所建立的semi-finals-2018專案。
9. 教學參考:建立專案請參考以下網址 https://yehchitsai.gitbooks.io/linux-usage/…/use_gitlab.html