系列研究在体育科学研究中的价值及设计思路images.sport.org.cn/file/2019/06/12/1028028683.pdf ·...

8
88 2019年(第39卷)第5Vol. 39,No.5,88-95,2019 CHINA SPORT SCIENCE 文章编号:1000-677X(2019)05-0088-08 DOI:10.16469/j.css.201905009 系列研究在体育科学研究中的价值及设计思路 张连成 1* ,张力为 2 1.天津体育学院 竞技运动心理与生理调控重点实验室,天津 3016172.北京体育大学 心理学院,北京 100084要:科学研究具有连续性,需要一点一滴的积累。系列研究可以巩固科研中观察到的事实,进而推动科学的 进展。系列研究的价值主要体现在:验证研究结果的可重复性,提高研究的整体效度,进而为科学研究提供强证 据或证据链。体育科学领域的系列研究可以从提高研究内部效度的视角,通过额外变量的控制、内在机制的探 讨、调节变量的引入、研究方法的变换等进行设计;也可以从增加研究外部效度的角度,通过改变自变量的操控 方式、变换因变量的测量方式、转变研究情境、扩大被试群体以及拓展应用领域等策略来开展。当然也可以将上 述研究策略结合起来使用以有序推进系列研究。体育科研人员在今后的研究中应尽可能考虑采用系列研究设计, 进而为体育科学研究的发现与实践提供强证据和证据链。 关键词:系列研究;可重复性;研究效度;内部效度;外部效度 中图分类号:G804 文献标识码:A 科学研究的终极目标是尽可能地接近、建立事实,倘 若研究者发现某种事实,而这种事实却是随机产生的,那 么就会产生虚假结果。虚假结果呈现为两种形式:假阳性 结果是研究所发现“现象”或“事实”并不是真实现象或 事实,而是随机现象;假阴性结果是研究没有发现应该发 现的真实现象或事实。这些虚假结果的后果会直接误导实 践。例如,医学科研的假阳性结果会将一个无效的医疗手 段视为有效,进而导致医生推广使用后无治疗效果,或使 用很多非必要的治疗手段(Nuovo,2016)。进行系列研究是 科研方法中遏制虚假结果的必要手段。一个常用的方法是 研究者在对研究问题进行清晰界定的基础上对研究问题进 行恰当分解,进而通过系列研究来解答,这种方法常见于 对较为宏观的研究问题进行研究;另一个方法是研究者采 用平行的或并列的多次实验设计,通过反复验证来揭示所 研究事物的规律,从而验证其可重复性、逻辑性,以避免 产生虚假结果,进而提高研究的效度。 综上,系列研究是指围绕某一研究问题,采用横向并 列多研究设计或纵向层层递进设计来揭示变量之间的关 系,以使研究结果可重复性更强,研究效度更高的包含 2 个或更多子研究的设计。这一开展系列研究的趋向也渐渐 被体育科学研究领域的学者所重视。张力为等(2013)曾 比较了 2010 年 Journal of Personality and Social Psychology JPSP)、《心理学报》与《体育科学》3本学术月刊刊载 的系列研究论文情况。结果发现,《体育科学》2010年没 有一篇论文是系列研究,而 JPSP 和《心理学报》则刊登了 较多的系列研究论文,尤其是 JPSP 每一期都有超过一半的 论文使用的是系列研究设计。作者对《体育科学》2017 年 的 12 期论文进行统计后发现,共刊载实证研究论文 47 篇,系列研究论文 3 篇,系列研究所占比例为 6.38%,较 过去有所提高,但仍不是体育科学研究的主流。因此,本 文将围绕系列研究的价值及其设计思路来进行讨论,以帮 助读者了解体育科学领域开展系列研究的基本逻辑和具体 做法。 1 系列研究的价值 1.1 验证研究的可重复性 方法学学者曾警告说,不可重复的单一研究无论如 何精心设计,结果无论如何具有统计意义,在对所研究 现象的深层次理解、概括和因果解释上都几乎毫无意义 (Hubbard et al.,2013; Nelder,1986; Popper,1959)。可重复性 是通过科学研究认识事物的基本原则之一。研究结果的可 重复性帮助人们避免不加批判地接受似是而非的研究结 收稿日期:2018-11-26修订日期:2019-05-03 基金项目:天津市哲学社会科学规划研究项目(TJTY16-014) *通信作者简介:张连成(1981-),,副教授,博士,主要研究方向为运 动心理学, E-mail: [email protected]

Upload: others

Post on 06-Jul-2020

17 views

Category:

Documents


0 download

TRANSCRIPT

88

体 育 科 学 2019年(第39卷)第5期Vol. 39,No.5,88-95,2019

CHINA SPORT SCIENCE

文章编号:1000-677X(2019)05-0088-08 DOI:10.16469/j.css.201905009

系列研究在体育科学研究中的价值及设计思路

张连成 1*,张力为 2

(1.天津体育学院 竞技运动心理与生理调控重点实验室,天津 301617;2.北京体育大学 心理学院,北京 100084)

摘 要:科学研究具有连续性,需要一点一滴的积累。系列研究可以巩固科研中观察到的事实,进而推动科学的

进展。系列研究的价值主要体现在:验证研究结果的可重复性,提高研究的整体效度,进而为科学研究提供强证

据或证据链。体育科学领域的系列研究可以从提高研究内部效度的视角,通过额外变量的控制、内在机制的探

讨、调节变量的引入、研究方法的变换等进行设计;也可以从增加研究外部效度的角度,通过改变自变量的操控

方式、变换因变量的测量方式、转变研究情境、扩大被试群体以及拓展应用领域等策略来开展。当然也可以将上

述研究策略结合起来使用以有序推进系列研究。体育科研人员在今后的研究中应尽可能考虑采用系列研究设计,

进而为体育科学研究的发现与实践提供强证据和证据链。

关键词:系列研究;可重复性;研究效度;内部效度;外部效度

中图分类号:G804 文献标识码:A

科学研究的终极目标是尽可能地接近、建立事实,倘

若研究者发现某种事实,而这种事实却是随机产生的,那

么就会产生虚假结果。虚假结果呈现为两种形式:假阳性

结果是研究所发现“现象”或“事实”并不是真实现象或

事实,而是随机现象;假阴性结果是研究没有发现应该发

现的真实现象或事实。这些虚假结果的后果会直接误导实

践。例如,医学科研的假阳性结果会将一个无效的医疗手

段视为有效,进而导致医生推广使用后无治疗效果,或使

用很多非必要的治疗手段(Nuovo,2016)。进行系列研究是

科研方法中遏制虚假结果的必要手段。一个常用的方法是

研究者在对研究问题进行清晰界定的基础上对研究问题进

行恰当分解,进而通过系列研究来解答,这种方法常见于

对较为宏观的研究问题进行研究;另一个方法是研究者采

用平行的或并列的多次实验设计,通过反复验证来揭示所

研究事物的规律,从而验证其可重复性、逻辑性,以避免

产生虚假结果,进而提高研究的效度。

综上,系列研究是指围绕某一研究问题,采用横向并

列多研究设计或纵向层层递进设计来揭示变量之间的关

系,以使研究结果可重复性更强,研究效度更高的包含 2

个或更多子研究的设计。这一开展系列研究的趋向也渐渐

被体育科学研究领域的学者所重视。张力为等(2013)曾

比较了 2010 年 Journal of Personality and Social Psychology

(JPSP)、《心理学报》与《体育科学》3 本学术月刊刊载

的系列研究论文情况。结果发现,《体育科学》2010 年没

有一篇论文是系列研究,而 JPSP 和《心理学报》则刊登了

较多的系列研究论文,尤其是 JPSP 每一期都有超过一半的

论文使用的是系列研究设计。作者对《体育科学》2017 年

的 12 期论文进行统计后发现,共刊载实证研究论文 47

篇,系列研究论文 3 篇,系列研究所占比例为 6.38%,较

过去有所提高,但仍不是体育科学研究的主流。因此,本

文将围绕系列研究的价值及其设计思路来进行讨论,以帮

助读者了解体育科学领域开展系列研究的基本逻辑和具体

做法。

1 系列研究的价值

1.1 验证研究的可重复性

方法学学者曾警告说,不可重复的单一研究无论如

何精心设计,结果无论如何具有统计意义,在对所研究

现象的深层次理解、概括和因果解释上都几乎毫无意义

(Hubbard et al.,2013; Nelder,1986; Popper,1959)。可重复性

是通过科学研究认识事物的基本原则之一。研究结果的可

重复性帮助人们避免不加批判地接受似是而非的研究结

收稿日期:2018-11-26;修订日期:2019-05-03

基金项目:天津市哲学社会科学规划研究项目(TJTY16-014)

*通信作者简介:张连成(1981-),男,副教授,博士,主要研究方向为运

动心理学, E-mail: [email protected]

张连成,等:系列研究在体育科学研究中的价值及设计思路

89

果,这些结果的来源常见于研究者不知觉所犯的统计 I 型

错误(得出假阳性结果的结论),无意中所犯的其他错误,

或有意识的违反学术道德进行欺骗(Hubbard et al.,1994)。

开展可重复性研究可以巩固科研中观察到的事实或经验概

括,进而推动科学的进展(Hubbard et al.,2013)。目前,科

学界对多个研究领域的可重复性不断地进行质疑。Nature

杂志对 1 576 名研究者进行调查发现,超过 70%的研究人

员尝试过并且未能重现另一位研究者的实验结果,超过一

半的研究者未能重现他们自己的实验结果,90%的研究者

认为在科学界存在着可重复危机,有 52%的研究者认为存

在可重复的重大危机(Baker,2016)。

在改进研究的可重复性方面,学者们给出了提前注

册,开放数据库,改进统计方法,使用元分析等举措(胡

传鹏 等,2016; Cumming,2014)。除此之外,也可以考虑通过

设计系列研究来进行可重复验证。正如牛津大学的神经心

理学家 Bishop(2016)曾指出,心理学上的经典效应,如

“系列位置效应”(Serial Position Effect)等之所以能够经得

住可重复检验,是因为当初心理学家们常常会通过一系列

实验,来证明这一效应的存在,并阐明这些心理效应的适

用条件,而这个过程本身也是一种可重复性研究。

可见,围绕某一主题开展系列研究,是验证研究可重

复性的有效方法。可重复性研究可以使用直接验证、系统

验证、概念验证等方法(郭秀艳 等,2005)。在直接验证

中,研究者努力尽可能准确地重复原实验,看能否在第二

次得到同样的实验结果。而在系统验证中,则会变换某些

实验条件来观察先前实验结果是否仍然会出现;研究者的

兴趣并不在于精确地重复实验,而在于描述某一现象产生

的边界条件,即保证该现象存在的条件是什么的问题。在

概念验证中,则更强调变换研究范式等,讨论某一概念或

某一理论的可重复性。早在 1993 年,Lindsay 等就建议在发

表实证结果时,期刊应鼓励某种程度的可重复性研究,至

少是一些内部的简单重复(直接验证)。若重复成功,应该

简要报告重复的结果。若是进行差异化的可重复性研究

(系统验证或概念验证),则有必要详细描述变化的研究条

件和背景等方面。系列研究更多地体现在差异化的重复性

研究上。在概念或理论上进行重复性研究,可以检验研究

发现的事实和经验是否可以得到概化,是否可以拓广研究

或理论的应用范围,进而为科学研究积累可信赖的证据

(Uncles et al.,2013)。

1.2 提高研究的整体效度

研究效度是指研究真实、正确地揭示所研究问题的本

质及其规律的程度,即研究结果符合客观实际的程度(董

奇,2004)。研究效度是评价一项研究质量的重要标准,也

是该研究能否在实践中得以应用的重要前提。研究效度包

括内部效度和外部效度。内部效度指研究中自变量与因变

量之间存在一定关系的明确程度(董奇,2004)。外部效度

指研究结果能够一般化和普遍化到样本来自的总体和其他

变量条件、时间和背景中去的程度,即研究结果的普遍代

表性和适用性(董奇,2004)。

在实验研究中,对实验条件和环境施加控制和使用对

照组的目的往往就是为了保证因变量测量值的(内部)效

度。因此,对实验条件和环境施加控制程度往往和研究结

果的内部效度成正比。但由于对实验条件和环境施加控制

程度越高,实验环境和真实环境的差距就越大,因此,对

实验条件和环境施加控制程度和研究结果的外部效度成反

比。因此,系列研究还包括了一个非常重要的方面,即对

实验室得到的结果,哪怕在实验室条件下已经重复成功,

也要在不同的环境中(特别是真实环境)进行重复系列研

究,以建立和维护研究结果的外部效度。例如,段艳平等

(2012)针对中德成年人被试进行的“从无活动到保持活

动的 4 步骤(FIT)模型”的跨文化系列研究结果表明,

FIT 能够较准确地描述中德两国成年人身体活动变化过程

的阶段性特征及其影响因素,并且效度、诊断功能及服务

干预的功能均得到初步验证。正如 Munafòt 等(2018)所

强调的,仅具有可重复性还远远不够,坚实的研究结论需

要多种证据,也就是验证该研究结果在不同的环境下是否

还成立。

由于建立研究结果的外部效度常常要在改变了的实验

条件下和环境中进行,对研究者带来的挑战是巨大的。比

如,环境的改变造成控制变量和原始研究的控制变量有所

不同,或常常会有一些无关因素混杂在相同的控制变量

中,这些因素都会导致对因变量呈现程度的变化使其或观

测不到或过度呈现。这些实验条件或环境的变化也会导致

自变量产生变化,影响研究结果的内部效度,造成研究结

果不可靠。反过来说,在不同实验条件和环境下重复,这

恰恰是系列研究的价值所在。

另外,研究者进行研究的目的往往是为了发表研究成

果。在学术刊物发表方面,一个常常出现的现象是发表偏

倚性(Publication Bias),即阳性结果(如定量方法中具统

计显著性的结果)更容易得到发表的现象。发表偏倚性是

一种系统误差。由于阴性研究结果不常得到发表,所发表

的阳性研究结果使外部效度向虚假高端游移,即向着有统

计意义的方向偏移。因此,发表偏倚性最终会降低研究结

果的外部效度。已有研究者指出,心理学中自我损耗领域

的研究中存在发表偏倚现象(Carter et al.,2014)。由于阴性

结果得不到发表,所以出现高估外部效度,即研究结论与

实际观察的吻合性低,因此,立足于这些研究结果上的结

论并不可靠(Carter et al.,2015)。

不显著的研究结果必须受到和显著性研究结果同样的

重视。在进行文献分析工作时,研究者必须尽可能将所有

不显著的研究结果也纳入到文献分析中,这样才能反映某

一领域的研究全貌。为避免发表偏倚性,除了期刊应该鼓

《体育科学》2019 年(第 39 卷)第 5 期

90

励发表不显著性结果论文外,研究者也可以通过构建系列

研究来整合那些不一致的研究结果。最近,有一些研究者

在以往元分析的基础上,提出可以使用迷你元分析(Mini

Meta-analysis)的方法对系列研究的结果进行整合,进而

明确自变量与因变量的关系(Goh et al.,2016)。

1.3 提供强证据或证据链

科学研究的可信度建立在科学事实的基础上。何为科

学事实?证据在哪里?这就需要研究者提供有力证据,这

样研究结论才能被接受和推广。研究的信、效度是决定一

个研究为科学提供证据质量的直接因素,因此,系列研究

在验证研究可重复性,提高研究效度的同时,可以进一步

为科学研究的发现和实践提供强证据或证据链。

关于证据强度的评价,可以参考循证实践领域的相关

研究。张力为等(2017)曾给出体育科学研究为运动实践

提供证据的力度(图 1),从图 1 不难看出,实验研究的证

据强于调查研究,多个研究的证据强于单一研究。可见,

开展系列研究可以为体育科学领域提供更强的证据。例

如,孙拥军等(2013)通过 1 项质性研究与 2 项实验讨论

了自控损耗对运动员运动表现的影响,质性研究发现,实

施自我控制产生的损耗会导致运动员的运动表现受到不利

影响;2 项实验则进一步检验了自控损耗对运动员运动表

现的影响,实验 1 研究发现自控损耗(思维抑制任务)不

利于运动员注意的稳定保持,实验 2 研究发现自控损耗

(注意控制任务)会降低运动员处理冲突与应对干扰的能

力。通过这 3 项研究,为自控损耗对运动操作表现的不利

影响提供了可信赖的证据。

图 1 调查研究与实验研究提供因果关系证据的力度

(张力为 等,2017)

Figure 1. The Strength of Evidence in Causality about

Investigation and Experimental Research

证据链往往体现在递进关系假设检验的系列研究上。

例如,王进(2005)的研究通过 3 个系列实验揭示了运动

中的“Choking”现象,实验 1 研究了有意控制对运动中

“Choking”的影响,实验 2 进一步检验了与自我注意有关

的压力是否会引起自我关注进而影响操作表现,实验 3 则

更进一步地讨论了自我意识强以及特质性焦虑高的人是否

更可能在压力情境下出现“Choking”。由此可见,系列研

究通过层层递进、环环相扣的逻辑链条和证据链条为该领

域的研究与实践提供了强有力的证据。

2 系列研究的设计思路

2.1 依提高内部效度视角设计

2.1.1 额外变量的控制

对额外变量的恰当控制是增加研究内部效度的重要保

障,但有时可能在一个研究完成之后才会发现某一个或某

些无关变量可能对结果产生影响。因此,通过对额外变量

的进一步控制,就可能成为后续研究的起点,成为系列研

究有序推进的策略之一。例如,Werle 等(2015)在实验 1

中将研究参与者分配到在运动组(告知该研究的目的就是

锻炼,要求他们在地图上 6 个不同的停止点指出他们的能

量水平)或有趣组(参与者被告知这项研究的目的是通过

mp3 播放器听音乐,并在 6 个不同的停止点评估音乐的清

晰度),之后测量食物消耗。研究发现,有趣组的参与者比

运动组的参与者摄入的卡路里更少。随后,研究者发现,

研究 1 中的有趣组可能因为有音乐使得他们的情绪更加积

极。据此,研究者改进了实验设计,在实验 2 中将有趣组

的实验条件描述为校园参观,并且参与者被指示在运动条

件下观光。完成任务后,为他们提供甜点作为感谢,结果

同样发现,运动组食用了更多的甜点。

再如,Sun 等(2016)通过两个实验探讨了移动目标

任务中静眼对运动表现的影响。实验 1 通过掩蔽法(无掩

蔽、小掩蔽、大掩蔽)操控静眼开始时间,进而操控不同

时长的静眼时间。结果发现,静眼时间越短,运动表现越

差。随后,研究者发现,对静眼开始时间进行掩蔽操控,

也延迟了动作开始的时间,限制了可用于技能在线控制的

时间。这样就导致结果混淆,到底是预编程,还是在线控

制对运动表现的影响。因此,研究者在实验 2 中通过掩蔽

法操控静眼开始时间和结束时间,以探索晚期视觉信息对

截击任务表现的影响。结果发现,同实验 1,早期信息遮

蔽同样可以缩短静眼时长,进而影响截击动作表现;晚期

遮蔽条件进一步回答了静眼准备期的重要性,更长时间的

早期加工可以补偿整体静眼时间缩短和晚期视觉信息缺失

带来的问题。

2.1.2 内在机制的探讨

科学研究需要不断积累研究证据,其中策略之一便是

从发现研究结果到对内在机制的探讨。而这种探讨往往通

过两个途径展开:1)引入中介变量和观察中介效应;2)

对 RCT 元分析的综合

对 RCT 研究的元分析

RCT 实验

非 RCT 实验

调查研究元分析的综合

调查研究的元分析

调查研究 弱

张连成,等:系列研究在体育科学研究中的价值及设计思路

91

探讨脑的结构与功能。

关于引入中介变量和观察中介效应,本文介绍两例。

第 1 个例子来自宋刚等(2017)的研究。他们通过两个实

验分别探讨了耐力训练不同时间点 C57BL/6J 小鼠 ATGL 基

因和蛋白表达的变化及 ATGL 变化可能的信号分子机制。

实验 1,C57BL/6J 小鼠进行 4 周的跑台耐力训练,使用实

时荧光定量 PCR 和蛋白质印迹法测定腓肠肌和比目鱼肌

ATGL 基因和蛋白表达的变化;实验 2,采用跑台耐力训练

小鼠 4 周,分别每天腹腔注射 forskolin、T0070907 和

DMSO,测定腓肠肌和比目鱼肌 ATGL 基因和蛋白表达的变

化。结果发现,耐力训练会引起 C57BL/6J 小鼠比目鱼肌和

腓肠肌中的 ATGL 基因和蛋白表达上升,而信号分子

cAMP 和 PPAR-γ参与了这一过程。第 2 个例子来自徐飞等

(2017)的研究。他们通过两个实验分别探讨了运动性肌

损伤(EIMD)后低氧对细胞膜通透性的影响及其机制问

题。该研究首先通过大鼠 EIMD 模型,研究 EIMD 后低氧

对细胞膜通透性的影响,探索低氧调控 EIMD 膜损伤效果

及与 MAPK 各信号通路的关系,再通过测定抑制 MAPK 各

信号通路对膜损伤的影响,明确 MAPK 信号通路中有关低

氧调控 EIMD 后膜损伤的机制。结果发现,EIMD 后低氧明

显加剧膜损伤并造成损伤峰值前移,低氧调控膜损伤主要

通过 BMK1 通路实现,抑制 BMK1 磷酸化能阻止低氧对膜

损伤的加剧作用。BMK1/ERKS 通路是低氧调控 EIMD 后膜

损伤 MAPK 机制的关键途径。

关于探讨脑的结构与功能,本文仅介绍一例。王丽丽

等(2018)通过 3 项实验探讨了中国运动员赢分和输分后

的面孔表情和身体姿势。实验 1 通过评估运动员赢分与输

分条件下面孔表情和身体姿势的效价和强度,实验 2 进一

步探讨了运动员赢分和输分后面孔表情和身体姿势的情绪

类型。前两项研究结果似乎表明,相比面孔,身体信息更

能区分赢分和输分的效价,而且身体姿势传递的情绪内容

相对单一,面孔表情传递的情绪内容相对复杂和多样化。

实验 3 采用 ERP 技术探讨产生这一现象的脑机制,结果发

现,身体的情绪信息能更早地被大脑识别,表现在 N170

成分上,面孔表情的情绪效应反映在 EPN 成分上。在加工

的晚期,面孔和身体条件下,均观测到胜利比失败表情诱

发了更大的 LPP 成分。结果表明,大脑在多个阶段对身体

姿势进行情绪评估与分类,为行为上身体对效价的高区分

性提供了证据。

综上,在发现变量关系之后,再探讨内在机制可以进

一步阐释变量间作用的机理,为明确自变量与因变量之间

的因果关系提供中介效应证据或脑功能证据,进而提高整

个研究的内部效度。不仅如此,内在机制的探讨,还将对

已有理论的完善与发展提供依据。

2.1.3 调节变量的引入

调节变量指影响自变量(或预测变量)和因变量(或

准则变量)之间的关系强度或关系方向的变量(张力为,

2001)。在以往很多研究领域,人们发现研究结果存在不一

致现象,而产生不一致的一个重要原因便是存在调节变

量,即研究中变量关系的存在需要界定在一定的条件下。

例如,李强等(2018)分别通过观察法和访谈法探讨了青

少年足球教练员的训练模式和执教方式。首先,通过对 13

名青少年足球教练员训练课进行客观观察,并使用修订后

的青少年足球教练员执教观察记录表来统计教练员的训练

模式和执教方式,研究发现,青少年足球教练员应用“直

接式”训练模式多于“情境式”训练模式,更多的使用训

练指令。然后,通过对教练员的半结构访谈来了解教练员

训练和执教的理念,结果发现,访谈结果与训练实际观察

结果存在较大差异,即教练员在训练中的实践操作与他们

访谈语言表述的训练理念相悖。这就提示研究者,需要关

注造成研究结果不一致的第三变量,进而考察变量关系存

在的边界条件问题。

再如,郑程浩等(2017)通过两项研究探讨了葡萄糖

补给时机对运动员自控损耗的影响。实验 1 选取 72 名男性

网球运动员,探究补给时机和补给策略对 Handgrip 任务

(坚持性自控任务)坚持时间的影响;实验 2 选取 72 名男

子篮球运动员,探讨补给时机和补给策略对 Visual-CCPT

任务(认知性自控任务)的虚报数、漏报数和反应时的影

响。结果发现,自控损耗前、后补给葡萄糖均可提升运动

员坚持性自控任务的表现;自控损耗后补给葡萄糖对于改

善认知自控任务表现的效果不大,自控损耗前补给葡萄糖

可有效促进运动员认知性自控任务的表现。提示,为了控

制自控损耗的负面影响,应该根据自我控制任务的不同来

选择合适的葡萄糖补给策略。

通过上述例子可以看出,通过引入调节变量,研究者

可以进一步明确自变量对因变量产生作用的边界条件所

在,进而提高研究的内部效度。

2.1.4 研究方法的变换

近 10 年来,共同方法偏差(Common Method Biases)

问题越来越引起学者们的重视。所谓共同方法偏差,指的

是因为同样的数据来源或评分者、同样的测量环境、项目

语境以及项目本身特征所造成的预测变量与效标变量之间

人为的共变(周浩 等,2004)。而解决共同方法偏差的一个

重要手段便是采用多种研究方法。通过变换不同的研究方

法,可以有效控制单一方法内在的系统误差,进而提高整

个研究的内部效度。这一思路至少可以从 3 个方面进行:

第一,从调查研究到实验研究。Grohs 等(2015)通过

2 项调查和 1 项实验探讨了球迷对对方球队赞助商的负面

态度和抵消负面态度的方法。第 1 项调查研究发现,球迷

对自己球队赞助商的态度明显好于对对方球队赞助商的态

度与非球迷的态度;第 2 项调查研究发现,对球队的认同

虽然不会导致对竞争对手的冷漠,但会导致对对手球队赞

《体育科学》2019 年(第 39 卷)第 5 期

92

助商的负面认知;研究 3 的实验研究发现,当团体成员将

赞助者视为外群体时,赞助会产生负面影响,团队认同水

平增加了对对手团队的负面群体感知,球迷对对方球队的

赞助商的负面态度随着团队内部认同的程度而增加。

第二,从质化研究到量化研究。陈小蓉等(2017)的

研究首先基于我国体育非物质文化遗产传承保护工作模式

和扎根理论,运用实地考察法、质性研究法以及德尔菲法

等研究方法,构建了中国体育非遗综合评价体系(包括申

遗评价和申遗后保护评价两部分)。然后使用申遗后保护评

价体系对我国国家级和省级体育非物质文化遗产项目进行

了具体评价,进而验证了该评价体系的有效性,结果表

明,体育非遗保护实践评价指标的鉴别力较为理想,该评

价体系的各指标能够区分和鉴别不同类型体育非遗保护措

施的优劣程度。史小强等(2018)也是采用这一策略,首

先使用文献和深度访谈等质性研究方法建构了新时代我国

全民健身公共服务绩效的假设模型(主要包括全民健身公

共服务的服务效率、服务质量、服务民主性和服务回应性

4 个方面),随后选取了 12 个省(市),包括 30 个市

(县、区)的 2 400 位居民进行调查,检验了全民健身公

共服务绩效结构模型的有效性。

第三,从横向调查到纵向追踪研究。孙国晓等(2013)

从自我决定理论视角,通过横向和纵向两个研究检验了自

我决定动机对运动员心理疲劳的消极影响。通过对 225 名

现役运动员的横向调查发现,自我决定动机对心理疲劳 3

个维度均有可靠的负向预测作用。对 60 名柔道运动员冬训

前、后为期 12 周的纵向追踪研究发现,冬训初期的自我决

定动机对冬训末期运动员的心理疲劳具有可靠的负向预测

作用,冬训前、后自我决定动机的变化程度对运动员心理

疲劳的变化具有可靠的负向预测作用。

综上,从调查到实验,从质化到量化,从横向调查到

纵向追踪,均是不断提高研究内部效度的有效策略。就像

Munafò等(2018)在 Nature 上所发表的评论那样,坚实

的研究需要三角验证。也就是说,通过使用相互独立的不

同的方式方法验证结论。因为每一个方法都有互不相关的

假设、优点和缺点,如果不同的方法得出相同的结果,那

么这个结果为假的可能性就下降了。正如 19 世纪中期博学

家 William Whewell 提出的“一致性”理论,它假设强大的

理论源于多重证据的综合论证,就像达尔文提出自然选择

学说时一样(Munafò et al.,2018)。可见,研究方法的不断

变换可以为研究结论提供三角验证,这也为研究者有序推

进系列研究提供了借鉴。

2.2 依提高外部效度视角设计

如前所述,可重复性是科学研究的重要特征之一。在

验证研究的可重复性时,学者们往往会通过系列研究来检

验已发现研究结果在更广泛情境中的适用性。因此,下文

将讨论依提高外部效度视角如何开展系列研究设计。

2.2.1 变换自变量的操控方式

通过增加自变量数目、变换自变量操作方式或条件来

设计系列研究,是增强研究外部效度的重要手段。胡路明

等(2018)通过 3 个实验探讨了多目标追踪中基于运动信

息的分组效应。该研究的主要思路为,实验 1 确立在多目

标追踪中存在基于运动信息的分组效应,实验 2 和实验 3

通过分别操纵不同颜色和不同形状组合特征来探讨基于运

动信息的分组效应的稳定性。实验 1 采用单因素三水平被

试内设计(设置 3 种不同的运动信息条件,分别对应目标

内配对运动、目标与非目标间配对运动和随机运动)来考

察这一分组效应。实验 1 发现,多目标追踪中存在基于运

动信息的分组效应,并且这一分组效应是自动化的。实验

2 采用 2(基于运动信息分组:目标与目标配对条件和目标

与非目标配对条件)×3(基于颜色分组:颜色相同条件、

颜色不同条件、颜色混合条件)的两因素被试内设计考察

不同颜色条件下基于运动信息的分组效应的稳定性。实验

3 同样采用 2(基于运动信息分组:目标与目标配对条件和

目标与非目标配对条件)×3(基于形状分组:形状相同条

件、形状不同条件、形状混合条件)的两因素被试内设计

考察不同形状组合条件下基于运动信息的分组效应的稳定

性。综合实验 2 和实验 3 的结果发现,不同表面特征的组

合不会干扰基于运动信息的分组效应的形成,但其效应量

均会因表面特征的改变而缩减。

该研究通过增加自变量个数、变更自变量操控形式设

计了 3 个系列实验,证明了多目标追踪中基于运动信息的

分组效应是稳定的,可靠的,进而提高了研究的外部效

度。

2.2.2 改变因变量的测量方法

因变量测量方式的改变也是推进系列研究的重要策略

之一。Dorris 等(2012)通过两个实验探讨自控损耗对运

动员常规训练的影响。实验 1 的研究参与者为 24 名男子赛

艇运动员,实验 2 的研究参与者为 18 名曲棍球运动员(2

男,16 女)和 6 名男子橄榄球运动员。实验要求损耗组运

动员首先完成从 1 000 连续减 7 的心算任务,产生自控损

耗,然后完成俯卧撑(实验 1)或仰卧起坐(实验 2)任

务。结果发现,自控损耗降低了运动员俯卧撑和仰卧起坐

的成绩。

再如,Werle 等(2015)分别在 3 项研究中使用了 3

种因变量的测量手段,为身体活动感知影响食物消耗提供

了可重复性验证。实验 1,研究参与者在有趣或运动两种

条件下进行 30 min 的步行活动,完成任务后邀请大家吃自

助餐,结果表明,两组人在随后的自助餐中摄入的热量没

有显著性差异,但是对所选甜点和饮料的卡路里进行分析

发现,有趣条件下的研究参与者比运动条件下的研究参与

者摄入的卡路里更少。实验 2,研究参与者还是在有趣或

运动两种条件下进行 30 min 的步行活动,完成任务后为他

张连成,等:系列研究在体育科学研究中的价值及设计思路

93

们提供甜点作为感谢,结果同样发现,运动组进食了更多

的甜点。研究 3 是一项真实的马拉松竞赛,参与者被要求

评估他们跑步时的乐趣,并提供巧克力棒(相对不健康的

食物选择)或谷物棒(相对健康的食物选择)之一作为实

验报酬,研究发现,人们对比赛的评价越有趣,他们就越

不可能在运动之后使用享乐食品(巧克力棒)进行补偿。

通过上述两个例子可以看出,不断变换因变量的测量

方式可以增加研究的外部效度,进而使研究获得的结论更

加稳定,这样可以为该领域的知识积累提供坚实证据。

2.2.3 转变研究情境

现场研究相对于实验室研究,可以提高研究的外部效

度,是更加客观地揭示自然、真实的心理活动规律的研究

方法。因此,诸多研究者在研究情境选择中,采用从实验

室研究转变到现场研究的思路有序推进系列研究。

王希等(2014)以自我决定理论为指导,通过 2 项研

究探讨了外部动机内化对运动员心理疲劳的影响。研究 1

包含 2 个实验室实验,分别通过无趣认知任务(从小到大

点击 1~100 之间的数字,练习时间 60 min)和无趣运动任

务(60 min 的飞镖靶心瞄准练习)诱发心理疲劳,并检验

不同程度外部动机内化对运动员心理疲劳的影响。研究 2

将研究情境转变到真实运动情境,以教练为运动员提供的

自主环境为自变量,考察运动员外部动机内化对心理疲劳

的影响。结果发现,无论是实验室实验,还是现场实验,

当运动员外部动机内化水平较低时,心理疲劳程度就越

高,通过创设自主支持的环境可以促进运动员外部动机的

内化,进而减轻运动员的心理疲劳程度。

Hüttermann 等(2018)也是通过实验室实验和现场实

验检验运动员注意力训练对运动员注意力视窗的影响及其

二者的效果差异。结果发现,无论是在实验室进行的计算

机认知训练,还是在现场对集体项目运动员进行的注意力

训练均对扩大运动员的注意力视窗产生积极作用,并且在两

种情况下,运动员的注意力表现得到了同等程度的提高。

2.2.4 扩大被试范围

在一些基础研究中,研究者常常先在动物群体中进行

实验,再在人类被试中进行实验,这也是系列研究有序推

进的策略。Kim 等(2015)分别通过动物实验和人类实

验,揭示了鸢尾素表达在抗阻训练改善肌肉力量和功能中

的重要作用。在动物实验中,将 19 个月大的雄性小鼠随机

分成对照组和阻力运动组(持续 12 周,每周 3 天进行具有

尾部负重的阶梯攀爬练习)。在人类实验中,40 名 65 岁以

上的女性参与者被分配到对照组或阻力运动组(持续 12

周,每周 2 天,每天 1 h 的弹力带训练)。动物实验结果发

现,阻力训练可以有效提高小鼠血清和比目鱼肌中的鸢尾

素水平,改善肌肉力量和肌肉质量。在人类实验中,与对

照组相比,阻力运动组的等速腿力和握力得到改善。此

外,鸢尾素水平与阻力运动组的握力和腿力呈正相关。因

此,抗阻训练可能是一种有效的干预方法,它可以增加鸢

尾素水平,防止与增龄相关的肌肉力量和功能退变。

此外,也有一些研究通过将研究结果推广到不同的人

群中来设计系列研究。Swami(2017)通过 3 个研究探讨了

人体写生对积极自我意向的影响。研究 1 对 84 名女大学生

进行一次人体写生的训练,结果发现,参与人体写生可以

提升女大学生的状态自我意向,但前提是绘画者观察的是

人体模特而不是非人体模特。研究 1 中都是女性研究参与

者,且都是女性模特。因此,研究 2 在研究 1 的基础上进

行了拓展,采用 2(绘画者性别)×2(模特性别)被试间

实验设计,结果发现,无论绘画者是否观察到模特与自己

性别一致或不一致,人体写生对女性和男性的身体意向都

有积极的影响。研究 1、研究 2 仅仅是考察了人体写生对

状态身体意象的影响,研究 3 探讨了长期人体写生对特质

自我意向的影响。结果发现,为期 6 周的人体写生课程干

预可以有效促进特质积极自我意向(身体吸引力和身体自

豪感),提高具身感,并减少社会体格焦虑;然而,干预对

负面的身体形象(为瘦身而努力和为肌肉发达而努力)没

有显著影响。该研究从女性拓展到男性,从状态自我意向

到特质自我意向,不断推进,提高了整个研究的效度,为

人体写生促进自我意向提供了坚实的研究证据。

2.2.5 拓展应用情境

实践是检验真理的唯一标准。好的研究一定会经得住

实践的检验,并对实践具有重要指导意义。因此,从科学

发现到具体情境下的实践检验也是开展系列研究的重要思

路。

舒川(2018)综合运用文献分析、访谈调查、问卷调

查、行动研究等研究方法,构建了学龄前残疾儿童运动康

复课程理论体系。之后开展了近 1 年的行动研究,结果发

现,该课程在实际教学中具有较强的可操作性,并能有效

提高学龄前残疾儿童的基础动作能力、体适能、认知及社

会适应能力。Papaioannou 等(2011)等通过两项研究探讨

了个人改善目标在健康生活中的积极作用。在研究 1 中,

研究者通过对 381 名成年女性的调查发现,生活中的个人

改善目标与积极的自我调节过程和自我效能信念相关联,

进而促进成年人规律锻炼;研究 2 进一步拓展了个人改善

目标在青少年人群中的应用,通过对 1 508 名青年学生为

期两年的纵向调查发现,生活中的个人改善目标可以正向

预测学生两年后的运动参与情况,可以负向预测吸烟和逃

学等负面行为。Williams 等(2002)通过两个实验检验了

预期技能在网球比赛中的重要意义。在实验 1 中,作者采

用专家新手范式,并使用逼真的电影模拟网球比赛,通过

对网球正手和反手击球运动表现和眼动指标进行分析,发

现了专家优于新手的预期技能的重要特征;在实验 2 中,

将实验 1 中发现的网球预期技能特征用于网球运动员的实

际训练中,结果发现,预期技能可以通过训练得到增强,

《体育科学》2019 年(第 39 卷)第 5 期

94

并且可以应用于真实比赛任务中。该研究从发现网球运动

员的预期技能特征(实验 1),到预期技能特征的具体应用

(实验 2),拓展了应用情境,进而提高了该研究的外部效

度。

需要特别强调的是,系列研究在有序推进时,也可能

是将上述多种策略结合在一起使用。耿晓伟等(2018)通

过 3 个实验考察了健康目标启动对食物热量摄入及其内在

机制问题。实验 1 是实验室实验,考察了健康目标启动对

高热量、低热量食物选择的影响;实验 2 是一项现场实

验,采用 2(健康目标启动:启动目标/控制组)×2(巧克

力热量:高热量/低热量)的被试间设计考察健康目标启动

对高热量和低热量食物摄入的影响,同时考察对食物的情

感预测的中介作用。为了提高研究的外部效度,同时进一

步检验前两个实验的研究结果,实验 3 以成年人为被试,

在真实情景中再次考察了健康目标启动对高热量和低热量

食物选择的影响,以及对食物的情感预测的中介作用。该

研究中,作者不仅从发现结果到探讨作用机制,设计了研

究 1、研究 2,而且从提高研究的外部效度角度进一步设计

了研究 3。Ring 等(2018)通过 3 个研究(1 项调查,1 项

实验和 1 项现场研究)探讨了成就目标在运动竞赛作弊中

的作用。研究 1 的调查发现,自我定向与运动员竞赛作弊

接受度呈正相关,与任务定向呈负相关;在研究 2 的实验

中,通过操纵不同的指导语,将研究参与者随机分配到自

我定向目标、任务定向目标和对照组中,然后让其在 1~7

分的作弊可能性上打分,结果发现,自我定向目标组较对

照组运动员作弊可能性更高,自我定向目标与任务定向目

标之间没有差异,但是任务定向目标组的作弊可能性也显

著高于对照组;在研究 3 中,作者使用现场研究的方法检

验了目标取向与跑步比赛中作弊的关系,结果发现,为了

增加在比赛中赢得奖金的机会而作弊的运动员比没有作弊

的人有更高的自我目标取向。该研究从调查(研究 1)到

实验(研究 2),提升了研究的内部效度,再到现场研究

(研究 3),扩展了研究的外部效度,为自我定向目标与竞

赛作弊之间关系的确定提供了层层深入的证据。

3 小结

科学研究需要一点一滴的积累,科学结论需要系列研

究提供强证据。否则,就像 Kaelin(2017)所言:“科学论

文的目标已经从使用多种方法来检验具体的结论,转移到

了以多种方式做出尽可能广泛的论断,而每个论断都基于

有限的证据。”证据对于科学研究大厦的重要性不言而喻,

而系列研究则可以提高研究的可重复性和说服力,为科学

研究的结论提供更强的证据或证据链。作者希望通过本文

呼吁,在强调大胆假设和创新开拓的同时,也要重视系列

研究体现的步步为营、小心求证的科学精神,将我们的研

究做实、做细、做深、做长。

致谢:感谢美国北卡罗来纳大学格林斯堡分校陈昂教

授对本文提出的极富启发性的建议。

参考文献:

陈小蓉,何嫚,张勤,等,2017.我国体育非物质文化遗产综合评价体系

的构建与应用[J].体育科学,37(5): 48-60.

董奇,2004.心理与教育研究方法[M].北京:北京师范大学出版社.

段艳平, BREHM W, STROBL H,等, 2012.成年人身体活动变化的理

论建构,问卷发展及系列实证研究:一项中德合作科研课题[J].天

津体育学院学报,27(3): 202-209.

耿晓伟,张峰,王艳净,等,2018.健康目标启动降低高热量食物消费[J].

心理学报,50(8): 840-847.

郭秀艳,杨治良,2005.基础实验心理学[M].北京:高等教育出版社.

胡传鹏,王非,宋梦迪,等,2016.心理学研究中的可重复性问题:从危机

到契机[J].心理科学进展,24(9): 1504-1518.

胡路明,苏晶,魏柳青,等,2018.多目标追踪中基于运动信息的分组效

应[J].心理学报,50(11): 1235-1248.

李强,韩玉,李文柱,2018.青少年足球教练员训练模式和执教方式研

究[J].体育科学,38(2): 45-54.

史小强,戴健,2018.新时代全民健身公共服务绩效结构模型的构建与

实证研究:基于“以人民为中心”价值取向的量度[J].体育科学 ,

38(3): 12-26.

舒川,2018.全人发展视野下学龄前残疾儿童运动康复课程理论与实

践[J].体育科学,38(2): 32-44.

宋刚,雷小灿,李莉,等,2017.耐力训练 C57BL/6J 小鼠工作肌 ATGL

的变化及信号分子 cAMP 和 PPAR-γ 的影响[J]. 体育科学,37(8):

44-49.

孙国晓,张力为,2013.自我决定动机影响运动员心理疲劳:横向与纵

向研究的证据[J].体育科学,33(7): 21-28.

孙拥军,张力为,李晓东,等,2013.自控损耗视角下对运动表现下降的

理解:来自质性与试验研究的证据[J].天津体育学院学报,28(4):

277-286.

王进,2005.压力下的“Choking”:运动竞赛中努力的反常现象及相关

因素[J].体育科学,25(3): 85-94.

王丽丽,冯文锋,贾丽娜,等,2018.赢分与输分运动员面孔表情和身体

姿势情绪的加工机制[J].心理学报,50(8): 892-906.

王希,张忠秋,张连成,等,2014.外部动机内化对运动员心理疲劳的影

响[J].天津体育学院学报,29(5): 381-388.

徐飞 ,黄巧婷 ,曹建民 ,等 ,2017.低氧调控 EIMD 后肌细胞膜损伤

MAPK 机制的探索与验证[J].体育科学,37(11): 63-71.

张力为,2001.调节变量在体育科学研究设计中的理论作用和统计计

算[J].体育科学,21(4): 77-80.

张力为,孙国晓,2017.体育科学实证研究的逻辑流与证据链[J].体育

科学,37(4): 3-10.

张力为,张凯,2013.体育科学研究方法向何处去?十个趋向与三个问

题[J].体育与科学,34(6): 6-16.

郑程浩,张连成,孙立冬,2017.葡萄糖补给时机对运动员自我损耗的

影响[J],体育科学,37(7): 30-36.

周浩,龙立荣,2004.共同方法偏差的统计检验与控制方法[J].心理科

学进展,12(6): 942-942.

BAKER M, 2016. Is there a reproducibility crisis? A Nature survey

张连成,等:系列研究在体育科学研究中的价值及设计思路

95

lifts the lid on how researchers view the 'crisis rocking science and

what they think will help[J]. Nature, 533(7604): 452-455.

BISHOP, 2016. There is a reproducibility crisis in psychology and we

need to act on it[EB/OL].[2016-03-05]. http://deevybee.blogspot.

com/2016/03/there-is-reproducibility-crisis-in.html.

CARTER E C, KOFLER L M, FORSTER D E, et al., 2015. A series of

meta-analytic tests of the depletion effect: Self-control does not seem

to rely on a limited resource[J]. J Exp Psychol, Gen, 144(4): 796-815.

CARTER E C, MCCULLOUGH M E, 2014. Publication bias and the

limited strength model of self-control: Has the evidence for ego

depletion been overestimated?[J]. Front Psychol, 5: 823.

CUMMING G, 2014. The new statistics: Why and how[J]. Psychol sci,

25(1): 7-29.

DORRIS D C, POWER D A, KENEFICK E, 2012. Investigating the

effects of ego depletion on physical exercise routines of athletes[J].

Psychol Sport Exerc, 13(2): 118-125.

GOH J X, HALL J A, ROSENTHAL R, 2016. Mini meta-analysis of

your own studies: Some arguments on why and a primer on how[J].

Soc Personal Psychol Compass, 10(10): 535-54

GROHS R, REISINGER H, WOISETSCHLÄGER D M, 2015.

Attenuation of negative sponsorship effects in the context of rival

sports teams’ fans[J]. Eur J Mark, 49(11/12): 1880-1901.

HUBBARD R, ARMSTRONG J, 1994. Replications and extensions in

marketing: Rarely published but quite contrary[J]. Int J Res Mark,

11(3): 233-248.

HUBBARD R, LINDSAY R M, 2013. From significant difference to

significant sameness: Proposing a paradigm shift in business

research[J]. J Bus Res, 66(9): 1377-1388.

HÜTTERMANN S, MEMMERT D, 2018. Effects of lab-and field-

based attentional training on athletes’ attention-window[J]. Psychol

Sport Exerc, 38, 17-27.

KAELIN Jr W G, 2017. Publish houses of brick, not mansions of

straw[J]. Nature News, 545(7655): 387.

KIM H J, SO B, CHOI M, et al., 2015. Resistance exercise training

increases the expression of irisin concomitant with improvement of

muscle function in aging mice and humans[J]. Exp Gerontol, 70: 11-

17.

LINDSAY R M, EHRENBERG A S, 1993. The design of replicated

studies[J]. Am Statistician, 47(3): 217-228.

MUNAFÒ M R, SMITH G D, 2018. Robust research needs many lines

of evidence[J]. Nature, 553(7689): 399.

NELDER J A, 1986. Statistics, science and technology[J]. J Royal

Statistical Soc. Series A (General),149(2): 109-121.

NUOVO G, 2016. False-positive results in diagnostic immunohistochemistry

are related to horseradish peroxidase conjugates in commercially

available assays[J]. Ann Diagn Pathol, 25: 54-59.

PAPAIOANNOU A G, SAGOVITS A, AMPATZOGLOU G, et al.,

2011. Global goal orientations: Prediction of sport and exercise

involvement and smoking[J]. Psycho Sport Exerc, 12(3): 273-283.

POPPER K R, 1959. The logic of scientific discovery[M]. Hutchinson:

London.

RING C, KAVUSSANU M, 2018. The impact of achievement goals on

cheating in sport[J]. Psycho Sport Exerc, 35: 98-103.

SUN G, ZHANG L, VINE S J, et al., 2016. The quiet eye provides

preplanning and online control support for interceptive task

performance[J]. J Sport Exerc Psychol, 38(5): 458-469.

SWAMI V, 2017. Sketching people: Prospective investigations of the

impact of life drawing on body image[J]. Body Image, 20: 65-73.

UNCLES M D, KWO S, 2013. Designing research with in-built

differentiated replication[J]. J Bus Res, 66(9), 1398-1405.

WERLE C O, WANSINK B, PAYNE C R, 2015. Is it fun or exercise?

The framing of physical activity biases subsequent snacking[J].

Marketing Letters, 26(4): 691-702.

WILLIAMS A M, WARD P, KNOWLES J M, et al., 2002.

Anticipation skill in a real-world task: Measurement, training, and

transfer in tennis[J]. J Exp Psychol- Appl, 8(4): 259.

The Value and Design Thought of Serial Research in Sports Science

ZHANG Liancheng1*, ZHANG Liwei2 1. Tianjin University of Sport, Tianjin 301617, China; 2. Beijing Sport University, Beijing 100084, China

Abstract: Scientific research has continuity and needs accumulation bit by bit. Serial studies can consolidate the facts observed in scientific research and promote the progress of science. The value of serial studies mainly includes: Validating the replicability of research, improving the validity of the research, providing strong evidence and chain of evidence for science research. Serial studies in sports science can design from the perspective of improving the internal validity of research, through controlling of additional variables, exploring mechanism, adding moderate variables, and transforming research methods. From the perspective of enhancing the external validity of research, serial studies can be carried out by changing the manipulation methods of independent variables, transforming the measurement method of dependent variables, transforming the research situation, expanding the group of subjects and expanding the application field. Of course, the above research strategies can also be combined to advance the serial studies in an orderly manner. This article expects more and more researchers to use series of studies designs to provide strong evidence and evidence chain for the discovery and practice of sports science research. Keywords: serial studies; replicability; research validity; internal validity; external validity