Transformer

體育

一舉拿下新SOTA，MILA博士：U-Net已死

2023-01-03DiT 模型 Transformer NET XL

要知道，這幾年雖然Transformer佔盡風頭，但U-Net在擴散模型領域仍然一枝獨秀——無論是“前任王者”DALL·E2還是“新晉生成AI”Stable Diffusion，都沒有使用Transformer作為影象生成架構...

科技

ACL 2019提前看：預訓練語言模型的最新探索

2022-01-10BERT 語言模型 Transformer 作者

在不同的語言文字上的 POS 實驗準確率示意圖為了深入研究多語言 BERT 為何能在不同的語言文字上具有良好的泛化能力，作者在詞性標註任務 POS 上做了一些實驗嘗試，結果如圖 3-3 所示...

科技

This post is all you need（基於Transformer的文字分類模型）

2021-11-14模型程式碼樣本 Transformer padding

在定義完這個函式後，我們便可以透過它來對每個batch中的資料集進行padding處理：第6步：構造與使用示例經過前面5步的操作，整個資料集的構建就算是已經基本完成了，只需要再構造一個迭代器即可，程式碼如下：在上述程式碼中，第2-5行便是分...

科技

關於Transformer中常遇到的問題解答

2021-11-12Transformer 矩陣解碼器多頭注意力

編碼器中的多頭自注意力層的作用是將原始文字序列資訊做整合，轉換後的文字序列中每個字元都與整個文字序列的資訊相關（這也是Transformer中最創新的思想，儘管根據最新的綜述研究表明，Transformer的效果非常好其實多頭自注意力層並不...

科技

This post is all you need（Transformer的實現過程）

2021-11-01編碼器 Transformer 實現程式碼 Embedding

解碼層前向傳播過程對於這部分前向傳播過程，可以透過如下程式碼來進行實現：在上述程式碼中，第10行程式碼用來定義圖3中Masked Multi-head Attention部分的前向傳播過程...

科技

如何看待swin transformer成為ICCV2021的 best paper？

2021-10-27CV Transformer Swin MSRA 我們

從孫老大、愷明、夷晨、季峰、祥雨、錫洲等等，到胡瀚、張拯和我，在組內傳承的是科研taste的培養和科研素質的訓練，包括如何產生一個好idea並把它做work、內部討論時平等激烈乃至對工作challenge到極致、對實驗solid程度的近乎苛...

科技

毫末智行：自動駕駛系統如何從“感知智慧”走向“認知智慧”？

2021-10-26毫末智行模型資料 Transformer

」毫末智行 CEO 顧維灝表示，有許多問題在規模化量產後才會遇到，比如車端感知可能遺漏很多潛在的高價值場景，能否挖掘出更有價值的資料，將海量資料訓練的比別人更快，將決定誰能佔領自動駕駛制高點...

科技

腦機介面賽道融資創紀錄，模型、資料和延遲等難題正被一一克服

2021-10-21BCI 大腦資料 Neuralink Transformer

與幾十年前將大腦活動轉化為行動的挑戰不同，如今BCI公司的主要目標是為大眾開發商業產品，這些產品要能夠在不同的大腦中找到共同的訊號，轉化為類似的行動，比如意味著“移動右臂”的腦電波模式...

科技

Transformer 眼中世界 Vs. CNN 眼中世界

2021-10-21ViT ResNet 表徵模型 Transformer

ViT 和 ResNet 表徵中的區域性和全域性資訊學習對 ViT 每層各個頭進行分析，每層各個頭算 attention 的平均距離，排序畫圖，如下發現，對於 ViT 模型，在底層就已經是區域性和全域性資訊都混在一起了，而上層則基本都是全域...

科技

雲+端自動選型訓練、Swin-Transformer、最高4卡ICU3.0平臺，毫末智行的自動駕駛野心曝光！

2021-10-14毫末智行模型資料 Transformer

科技

面對常識問題，人工智慧還很弱智

2021-09-30常識人工智慧研究機器 Transformer

機器常識專案資助了許多當前機器常識的研究工作，包括多模態開放世界接地學習和推理（Multi-modal Open World Grounded Learning and Inference， MOWGLI），這個專案能夠構建一個回答常識性問...

科技

什麼是自然語言的預訓練？

2021-09-29訓練模型掩碼詞語 Transformer

在ELMo的基礎上，OpenAI提出基於微調的預訓練模型GPT，使用Transformer解碼器替代LSTM作為網路的架構，先預訓練單向的Transformer語言模型，僅依賴於上文預測下一個詞語，再針對不同的下游任務，採用有監督的微調方法...

科技

華人團隊用Transformer做風格遷移，速度快、可試玩，網友卻不買賬

2021-09-27筆畫 Transformer Paint 預測器研究者

如下圖 5 所示，研究者將 Paint Transformer 分別與基於最佳化和基於強化學習的 SOTA 筆畫繪畫生成方法進行了比較...

科技

7 Papers & Radios | RobustART評測模型魯棒性；用Transformer做風格遷移遭質疑

2021-09-25Transformer 論文 learning resizer 模型

目錄：Paint Transformer： Feed Forward Neural Painting with Stroke PredictionRobustART ： Benchmarking Robustness on Architec...

科技

TransCenter: MIT&INRIA開源多目標物體跟蹤演算法

2021-09-25查詢 MOT Transformer TransCenter 目標

受近期基於錨點（point-based）MOT 方法的啟發，來自 MIT 等機構的研究提出 TransCenter，這是首個用於預測密集目標點熱力圖（dense center heatmap）Transformer MOT 架構...

科技

TransCenter：MIT＆INRIA開源多目標物體跟蹤演算法

2021-09-20查詢 MOT Transformer TransCenter 目標

科技

ICCV 2021：煉丹師的福音，訓練更快收斂的絕佳方案

2021-09-17SMCA DETR epoch attention Transformer

Spatially-modulated co-attention：給定動態生成的空間先驗G，用空間先驗G調製物件查詢Oq和自注意編碼特徵E之間的共同注意圖Ci：SMCA with multi-head modulation：研究者還研究了針...

科技

長序列時間序列預測（LSTF）

2021-09-15Transformer 預測序列 SELF attention

實驗效果從上表中，我們發現：所提出的模型Informer極大地提高了所有資料集的推理效果（最後一列的獲勝計數），並且在不斷增長的預測範圍內，它們的預測誤差平穩而緩慢地上升...

科技

替代離線RL？Transformer進軍決策領域，“序列建模”成關鍵

2021-08-07Transformer 建模學習 Decision 強化

Decision Transformer：強化學習的自迴歸序列建模研究者採用了一種簡單的方法：每個模態（返回、狀態或動作）都被傳遞到一個嵌入網路（影象的卷積編碼器和連續狀態的線性層），然後嵌入透過自迴歸 Transformer 模型處理，在...

科技

自然語言處理-預訓練模型BERT的發展現狀

2021-06-25模型 BERT Transformer 訓練單詞

一旦訓練了基本的BERT模型，你通常會在兩個步驟中進行調整：首先，對未標註的資料繼續進行“無監督”的訓練，然後透過新增額外的層和對新目標的訓練（使用很少標記的示例）來學習實際任務...

Transformer

標籤雲