/** * Copyright (c) Huawei Technologies Co., Ltd. 2023. All rights reserved. * * Licensed under the Apache License, Version 2.0 (the "License"); * you may not use this file except in compliance with the License. * You may obtain a copy of the License at * * http://www.apache.org/licenses/LICENSE-2.0 * * Unless required by applicable law or agreed to in writing, software * distributed under the License is distributed on an "AS IS" BASIS, * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied. * See the License for the specific language governing permissions and * limitations under the License. */ #ifndef OP_API_INC_LEVEL2_ACLNN_FLIP_H_ #define OP_API_INC_LEVEL2_ACLNN_FLIP_H_ #include "aclnn/aclnn_base.h" #ifdef __cplusplus extern "C" { #endif /** * @brief aclnnFlip的第一段接口,根据具体的计算流程,计算workspace大小。 * @domain aclnn_ops_infer * 对n维张量的指定维度进行反转(倒序),dims中指定的每个轴的计算公式: * * $$ * \operatorname{out}(i_0, i_1, * \ldots, i_{n-1}) = \operatorname{input}(j_0, j_1, \ldots, j_{n-1}) * $$ * * 其中,$n$是输入张量的维度,$ j_k$ = $\operatorname{dimSize}(k)$ -1 - $i_k$,$\operatorname{dimSize}(k)$ * 表示第$k$个轴的长度。 * * 计算图: * ```mermaid * graph LR * A[(Self)] -->B([l0op::Contiguous]) * B -->D([l0op::Flip]) * G((dims)) --> D([l0op::ReverseV2]) * D -->R([l0op::ViewCopy]) * R --> J[(out)] * ``` * @param [in] self: 待进行flip计算的入参。npu device侧的aclTensor, * 数据类型支持float16,float,int32,int16,int64,bool, int8, uint8,float64,complex64, complex128, 数据格式支持ND, * 支持非连续的Tensor。 * @param [in] dims: 表示需要翻转的轴。 * @param [in] out: flip计算的出参。npu device侧的aclTensor, * 数据类型支持float16,float,int32,int16,int64,bool, int8, uint8,float64, complex64, complex128,数据格式支持ND, * 支持非连续的Tensor。 * @param [out] workspace_size: 返回用户需要在npu device侧申请的workspace大小。 * @param [out] executor: 返回op执行器,包含算子计算流程。 * @return aclnnStatus: 返回状态码。 */ aclnnStatus aclnnFlipGetWorkspaceSize(const aclTensor *self, const aclIntArray *dims, aclTensor *out, uint64_t *workspaceSize, aclOpExecutor **executor); /** * @brief aclnnFlip的第二段接口,用于执行计算。 * @param [in] workspace: 在npu device侧申请的workspace内存起址。 * @param [in] workspace_size: 在npu device侧申请的workspace大小,由第一段接口aclnnFlipGetWorkspaceSize获取。 * @param [in] stream: acl stream流。 * @param [in] executor: op执行器,包含了算子计算流程。 * @return aclnnStatus: 返回状态码。 */ aclnnStatus aclnnFlip(void *workspace, uint64_t workspaceSize, aclOpExecutor *executor, aclrtStream stream); #ifdef __cplusplus } #endif #endif // OP_API_INC_LEVEL2_ACLNN_FLIP_H_