<samp id="u8ogy"><ins id="u8ogy"><u id="u8ogy"></u></ins></samp>
  • <menuitem id="u8ogy"></menuitem>
    <menuitem id="u8ogy"></menuitem>

    <progress id="u8ogy"><bdo id="u8ogy"><dfn id="u8ogy"></dfn></bdo></progress>
  • <progress id="u8ogy"><bdo id="u8ogy"></bdo></progress>
    <tbody id="u8ogy"></tbody>
  • 中國大模型語料數據聯盟開源發布高質量多模態語料“書生·萬卷”

    2023-08-14 21:05 人工智能

    據中證報消息,繼今年7月在2023世界人工智能大會發起成立“中國大模型語料數據聯盟”,上海人工智能實驗室于8月14日宣布,聯合語料數據聯盟成員單位,共同開源發布“書生.萬卷”1.0多模態預訓練語料。“書生.萬卷”1.0目前包含文本數據集、圖文數據集、視頻數據集三部分,本次開源的數據總量超過2TB。該語料數據包含超過5億個文本,2200萬個圖文交錯文檔,1000個節目影像視頻,具備多元融合、精細處理、價值對齊、易用高效等四大特征。
    事件追蹤

    人工智能指數:...

    婷婷综合网