请教大佬,在如图深度可分离卷积的计算公式中,公式中各变量所代表的含义

图片说明

图片出自论文《Depthwise Separable Convolutions for Neural
Machine Translation》
文中并未对这四个公式进行解释,希望有大佬给与解答。