News最新消息

首頁>最新消息>與AI語音對話-初賽第二場次線上比賽規則及檔案細項說明
與AI語音對話-初賽第二場次線上比賽規則及檔案細項說明2018-07-20回索引頁
初賽第二場次線上比賽將在本周六早上11:00進行
這次的規則及檔案細項跟第一場次有些微不同
比賽後,主辦方會提供第二場次正確答案
最新消息及內容請持續注意科技大擂台官網及FB更新

詳細賽制規則及檔案規格如下:

# 規則
1. 比賽時間:將於2018/7/21 (UTC+08:00)台北時間 11:00 AM~12:00 PM開啟,共計1小時。
2. 繳交限制:一小時內每位參賽隊伍最多只能上傳5次,比賽結束前可以選擇1筆上傳結果做為評分依據。
3. 參賽規則:每隊參賽隊伍僅能使用一個帳號,註冊多個Kaggle帳號來取得更多上傳次數是違背競賽規則,團隊分數將不列入採計。
4. 參賽名稱:請確保所有團隊所填寫的Kaggle名稱和官網報名時一致,將會於Gitlab上公布所有報名名單(僅kaggle名稱),如有不同還請寄信告知。
5. 其餘規則:一律根據官網上的說明及註冊參賽時規章為主。
6. Kaggle連結:請至gitlab Kaggle2查看。
7. Kaggle開放時間:將於2018/7/21 (UTC+08:00)台北時間 10:00 AM開啟。

# 檔案
1. 比賽音檔:請至Gitlab Kaggle2專案下載文章音檔,文章音檔(不加密),問題和選項音檔會預先加密壓縮,密碼將於比賽前半小時發佈。
2. 壓縮密碼:將於2018/7/21 (UTC+08:00)台北時間 10:30 AM 於Gitlab、官網、FB公布壓縮檔密碼。
3. 取樣格式:單聲道(Mono),16kHz,16 bits PCM 。
4. 音檔格式:*.wav 。
5. 音檔數量:一組包含[文章*1、題目*1、選項*1],共1500組 。
6. 檔案命名: 
* A文章:A0000001.wav,範例 A0000001.wav
* B題目:B0000001.wav,範例 B0000001.wav
* C選項:C0000001.wav,範例 C0000001.wav
7. 上傳格式:採用csv檔上傳,逗號分割。
* 欄位ID為題目編號(檔名去掉英文、數字前面補的0和副檔名.wav),不連續編號
* 欄位Answer為答案請填數字1到4

# 語料庫(必做)
1. 檔案1:單純語音辨認器辨認出的逐字稿的文字結果跟對應的記錄檔,尤其是字或詞的信心值分數。
2. 檔案2:經後級NLP或是其他方式校正過的逐字稿的文字結果跟對應的記錄檔,尤其是字或詞的信心值分數。
3. 檔案3:每題四個答案的分數。
4. 檔案4:說明檔,解釋上傳的檔案1~3的內容與格式。
5. 檔案5:系統描述,說明系統架構與做法。
6. 上傳方式:於gitlab建立名稱為Kaggle2的專案,並將5個檔案上傳。
7. 截止日期:台北時間(UTC+08:00) 7/23 23:59分截止。 
8. 繳交方式:至gitlab建立一個專案,名稱請命名為Kaggle2,並將這次比賽所產生的紀錄檔上傳至您自己所建立的Kaggle2專案,上限6個(一次比賽一個)。
9. 教學參考:建立專案請參考以下網址 https://yehchitsai.gitbooks.io/linux-usage/content/use_gitlab.html。